虚拟勘探:从数据中开采“黄金”
数据开采使用人工智能和统计学上的巧妙手段,以发掘隐藏在堆积如山的数据中的真知灼见(新潮流)
【美国《商业周刊》4月9日一期文章】题:虚拟勘探(记者 奥蒂斯·波特)
1901年1月10日,在得克萨斯州博蒙特附近的纺锤顶山上,一股石油从一口井中喷出———这是当时最为重大的石油发现。几乎是一夜之间,“黑色金子”成为推动强大工商帝国成长的动力,为汽车的诞生铺平了道路。
但是现在,石油工程师们较为可能发现宝藏的地方是得克萨斯州满屋子磁带的仓库,就把这叫作“数据开采”吧。数据开采所使用的是人工智能和统计学上的巧妙手段,以发掘隐藏在堆积如山的数据中的真知灼见。所采用的软件滴水不漏,十分擅长联想和发现微妙的关系,因而它经常有新的发现。其结果能够指向新的商机、新颖的产品和更好的制造工艺———尤其是当这些结果以图形的方式通过先进的成像系统呈现的时候。
从20世纪90年代中期以来,数据开采在一个又一个产业中扎根。国际商用机器公司商用智能部战略主任科拉尔宣称:“这基本上正在变成一种商业上非做不可的事情。”
人的头脑简直不能应付电脑和因特网所释放出的大量数据。伯克利加州大学的科学家们最近进行了估计,得出的数字令人惊呆。自从人类开始在山洞中绘画和在草纸上写字以来所产生的所有信息大约为18个exab y tes,即18后面加18个零。但是真正不可思议的是,仅仅1999年就产生了其中的12%,这12%之中的2/3是数字化信息。
在今年《商业周刊》评出的工商50佳当中,有1/3以上是能源和金融公司,这两个部门恰好是数据开采技术的先驱。这种技术正在成为在争夺市场份额的战斗中带来丰厚利润的有力武器。
在德士古公司,数据开采显然带来了丰厚的利润。它在发现尼日利亚近海的阿哥巴米大油田的过程中起了重大作用。该油田储量大约为14.5亿桶。有油的迹象是通过利用德士古公司的“地质勘探”(GeoProbe)数据开采系统对地震数据进行重新评估而发现的。该系统利用动画图像帮助地质学家找出突出地貌。在此之前,采用静止图像的传统方法没有发现这个油田。
该系统的特色是一个25英尺宽、9英尺高的屏幕,由硅图像技术公司制造的一台超级电脑将地震数据投射在它上面。该系统已经使作出钻井与否决策的时间从几个星期缩短到几个小时。今天,这种设备散布在全球石油工业的100多个地方。
硅图像技术公司之所以主宰着图像领域,是因为它的电脑使数据活了起来,成为一种互动式电影。地质学家们能够迅速浏览地下岩石构造,它们被用不同颜色标出,以显示地下沟壑和岩石密度的变化。项目专家载特林说,当这些数据被改造成移动图像的时候,“魔术般的事情发生了,你以前所没有注意的细节突然在你面前赫然显现”。
被信息淹没得最厉害的一个群体也许是科学家。在因特网上发表的研究结果的数量正在急剧增加。现在,数据开采能为他们提供帮助。例如,在新泽西州普林斯顿的日本电气公司研究所,波拉克领导的一个研究小组开发出了“引证发觉”(CiteSeer)程序,能够按照重要性排列网上发表的新的科学论文。
数据开采还有望帮助科学家们完成任务,这从在马里兰大学医学院举行的一次竞赛的结果就可判断。竞赛双方是一位神经外科医生和一个数据开采程序,比赛内容是制订一项利用辐射治疗脑肿瘤的方案。外科医生用肉眼观察患者大脑的X射线图片,然后决定如何实施放射治疗。在电脑运行过同一过程之后,神经外科医生最终选中了电脑所提供的较好方案。

相关文章
头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】