存档
这几年越来越多的手机开始加装GPS芯片, 具备了定位的功能。其实手机天然就有定位能力,可以根据连接的基站信息进行三角定位。只是由于运营商的策略问题,没有公开发布接口而已。 就国内来说,中国移动只把定位接口开放给了屈指可数的几家合作伙伴,用来做导航或者地图服务。所以普通的个人或者公司想要借助手机的定位信息来开展一些服务,基本上是不可能地。但是Google却有自己的办法绕开了运营商,自己推出了定位服务,用在了Google地图上。去谷歌下载一个手机版的地图,就会发现,没有GPS芯片的手机,也能给你定位个差不离。倒不是因为谷歌偷了移动的数据(这可比搜狗事件严重多了,呵呵),或者和移动合作了,而是Google使了个花招:凭借庞大的用户群,借助有GPS的用户来帮助没有GPS的用户。具体来说就是,当具有GPS芯片的用户使用Google Map客户端的时候,Google会把当前的位置信息和基站编号一起上传,存储到服务器上。随着用户位置信息的变化,以及用户量的增多,服务器上会存储了大量的基站和地理位置的匹配信息。这样,没有GPS芯片的用户发起请求的时候,只提供基站编号,服务器端也能够提供位置信息。 长此以往,中国移动当个宝贝似的捂着的基站地理位置数据,被别人用光明正大的方法拿到,于是含金量也会越来越低了。就像是电影《方世玉 II》里面的“师兄”李国邦的乾坤点穴大法,最后落得“收藏武功,是会贬值的”的感叹。 iPhone和iTouch上的定位方法,据说是采用了Google和一家叫做skyhook的服务,除了GPS和基站定位之外,还可以使用wifi定位(iTouch上可是没有GPS也没办法拿到基站信息的)。精确度在美国也是相当的高,可以在50英尺之内。纽约时报对此事的报道介绍了事情的来龙去脉。 除了这些办法,还可以整合什么信息,来更精确的定位呢? 被成为“物联网”基石的RFID标签,是一种能够主动或者被动接受射频信号的轻巧小卡片,如果这种标签能够大批量的被贴在任何地方,是不是会更精确的传输定位信息呢?据说下一代的iPhone就会带有RFID标签,看来RFID定位也要加入手机定位的”联盟”了。
贝叶斯公式是 条件概率中的一个重要式子,学的时候没心思去看,正巧非典不考试大家抄了抄就过了,现在再次看,发现很有意思。这个式子非常简单,含义也很明确,如果想要 预测未来的话,已经发生的数据越多越好,已有数据越精确,对未来的预测越准确。但是它有点难理解,尤其是当判断什么是p(x|w)什么是p(w|x)的时 候,比较有悖于直觉。下面是经典的一个问题: 步入40岁的女性患乳腺癌的几率是1%,现在有一种仪器,当被测者已经患了乳腺癌的时候,它测出来为阳性的概率为80%,当被测者没有患乳腺癌的时候,它误测为阳性的概率是9.6%,那么,当这个仪器测试一位40岁以上的女性为阳性时,她患有乳腺癌的几率为多少? 据说只有15%的医生给出了正确答案。所以被我问住并且回答几率在40%以上的也不必汗颜。直觉会倾向于在9.6%和80%之间取一个中间值,胆大 点的会猜的偏小一点。但是简单用bayes公式计算一下,会发现答案只有7.8%. 就是说,即使这个仪器测出来阳性,患病的几率也只有十三分之一。 对我们普通的群众来说(相对于数学牛人),有悖于直觉,不是吗?大部分人忽略了真实患病的几率只有1%. 可以去这么理解它:仪器的作用就是,把1%的几率,提高到了7.8%. 当然这不是说仪器让患乳腺癌的几率增大了,而是说给真正有可能患病的人一个比1%更确切一点的数字,尽管这个数字似乎仍然没什么作用。 这里给出了一种贝叶斯方法的直觉解释,对于我们这种没有数字敏感性的人群来说,图是最好的解释方式。这篇文章给出了图示来解释贝叶斯公式是怎样把预测的可能性增强的,很符合人的思维模式。 随着搜索引擎、机器学习等热潮的兴起,贝叶斯方法和马尔科夫模型越来越受人推崇,谷歌黑板报也科普过。具八卦传闻,在微软,if..else是软件开发的原子操作,在google,原子操作变成了贝叶斯方法和Markov模型。看来,google具有更高的视野,那里的某个大拿也曾在某次坐飞机的时候写了一段20多行的python代码,利用贝叶斯方法来实现拼写检查,有效率达到了70%-80%.