语义互联网的三大死因

作者： Cashcow
2013年11月04日
互联网, 动态, 大数据, 热点

data scientist

语义互联网（Semantic web）确实有趣，但人们忽视了更大的背景图，那就是人们其实并不关注知识图谱，人们只关心他们周边的人和“当下”的事。

语义互联网憧憬着将web变成数据和知识的交互网络，计算机组成的全球知识网络将最终能够理解人们的意图，并成为人们的获取信息和情报的新前线。

但在经过二十多年的尝试后，语义互联网已经成为投资者和消费者眼中的票房毒药。到底哪里出了问题，为什么我们的互联网依然与憧憬的语义智能互联网相去甚远？这是因为：

一、过期知识与活在当下

大多数web知识库的创建都不过是将“专家知识”转化成web数据。这些是相当无聊的web数据，从Google知识图谱的推广视频已经可以看出，语义web将变得多么无聊：“你准备搜索文艺复兴时期的画家吗？”有没有搞错，这年头有几个人还关心这个。

如今，导致信息爆炸的根源是消费端科技的繁荣，这导致知识的寿命变得越来越短（编者按：飞机上打手机或吃转基因食物到底是安全还是不安全还是安全？）Alvin Toffler在他开创性的《革命性财富》一书中曾杜撰了Obsoledge一词，来形容大量过期的知识。

如果我们要创建的数据互联网，我们必须将知识的定义扩展到“过期知识”和琐碎事实之外，例如我们不会关心达芬奇的身高或者哪些诺贝尔奖获得者生于1945年之前。我们更多关心的周围的人如何评价昨天晚上的电视热播剧大结局，还有什么剧集或者电影值得一看？

我们都活在当下。“当下“吸引着越来越多的注意力，过去正被快速尘封，人们的注意力、情绪和情感才是今日信息时代的关键元素，这些才是数据web的核心所在。

二、文档已死

从维基百科的文档中获取结构化信息的做法有着根本的缺陷。这不但催生了一个无聊的数据web，而且假定文档才是知识的源头，但事实不是这样的。文档（帖子、网页、文件、视频…）只是重要信息的一小部分，其背后的讨论和活动才是真正重要的（知识来源）。参考阅读：Google与Bing的搜索战略分歧

我们使用web的方式正在发生巨变，我们正在进入web的第二阶段——革命性的实时web，或者我们称之为“信息流”。“信息流”的重点是消息而不是web网页。海量的消息来自社交互动、讨论、关注、想法等等，大量思想都被释放并汇聚成海量的数据流。参考阅读：沃尔玛掘金快数据

这也改变了机器之间的通信方式。机器依然由人类编程操控，而人类，尤其是程序员们，总是容易犯懒。他们使用最容易的方式来实现机器间通讯。他们可不会花费很多天时间学习复杂的RDF或OWL规范，他们喜欢使用JSON来完成简易的沟通，最酷的那帮孩子们都已经抛弃了XML。

三、信息是用来“推”的，不是“拉”的

信息获取方式的问题也许不那么凸显，因为过去二十多年我们都已经习惯了在Google上用关键词搜索。但不幸的是，关键词搜索的根基已经崩溃。“外面”的信息越来越多，而关键词搜索的效果则越来越差。

类似Facebook的高级查询系统或者Wolfram Alpha仅仅比关键词搜索的效果好一点而已。甚至Siri这样的对话引擎也存在根本性的问题，因为人们不知道问什么问题。

事实上，我们需要的是这样一个web，信息能根据你对世界的关注、情绪和思想推送给你。

迎接神经突触网络（Synaptic Web）

关键词搜索已经过气，人们都浸泡在信息巨流中。人们对新一代信息获取方式的需求空前强烈。语义互联网将会成为下一个范型吗？恐怕未必。

是时候抛弃基于文档、知识和关键词搜索的范型了。我们生活在大数据时代，漂浮在实时信息流和情绪之上。我们需要的web应当是动态的以人为核心的web，能够理解个体需求并推送匹配数据和信息的web。这样的web看上去不太像数据库或者图谱，因为它是动态的、智能的甚至是混乱的。这更像是数字化的人类大脑，我们称之为神经突触网络（Synaptic Web）。

Via：GigaOM

关于作者：Dominiek Ter Heide是Bottlenose的创始人兼CTO，Bottlenose的专注将大数据技术与专业化数据挖掘技术整合，对数据流进行实时分析。


第一时间获取面向IT决策者的独家深度资讯，敬请关注IT经理网微信号：ctociocom


   除非注明，本站文章均为原创或编译，未经许可严禁转载。


相关文章：


                    美国公司称研发世界最大芯片，借此诞生120万亿“大脑级”AI模型
                                      恶意软件传播新趋势：毒化AI神经网络
                                      最好的机器学习情绪分析工具（创业公司）TOP5
                                      谷歌开源GPipe，高效训练大型深度神经网络
                                      一张图看懂所有神经网络
                                      2016年文本、语义、社交分析十大趋势
                                      十个值得一试的开源深度学习框架
                                      文本分析市场最有潜力的三家创业公司
                  



标签： Obsoledge, Synaptic web, 兴趣图谱, 神经网络, 语义分析, 语义搜索