曾经有段时间看过语义网的一些文章,当时也是发散的脑子要爆,后来工作“忙“,没有继续深究~, 今天看到cb上关于语义网的视频,又提醒了我,于是再写写自己的幻想,以备有生之年再来验证。
先说一下现在大家通过互联网获取信息的方法:
场景: 我想知道超市买的黄花鱼怎么做好吃,于是我在google的输入框里输入“黄花鱼 做法“,得到答案:获得约 290,000 条结果
(用时 0.29 秒),然后看到有蒜香黄花鱼,点击进入,信息成功获取。
搜索引擎是大家主动获取信息的主要途径,通过输入关键词,搜索引擎会给出近似的匹配结果给用户选择,用户再次过滤最终找到自己想要的信息。现在的引擎存在的问题:
- 蜘蛛能够爬到的信息是有限的,仅限于html
- 关键词的匹配不够智能, 用户还很难以口语话的描述获取到信息
- 重复结果和恶意的垃圾结果
- 匹配的维度太少,不像sns,搜索引擎没有用户的详细资料,不能够从更多的维度过滤结果,给用户提供匹配度更高的结果
- 用户碰壁的概率很高,因为有些内容是需要收费或者需要注册会员,等等
web 3.0( 语义网)的目的就是构建一个强大的信息路由和处理系统,互联网上海量的信息可以方便的获取和处理。
语义网时代:
场景一: 对引擎输入“黄花鱼怎么做“ 引擎反馈 第一条 “您的邻居xx发布了一个关于黄花鱼做法的视频“。通过对引擎使用者本身数据的引用引,擎找到了用户可能更感兴趣的结果。
场景二: 蛋疼的输入“今天全球有多少婴儿降生“,这个查询可能需要累加所有医院的出生数据,于是该引擎将查询路由到所有能够提供改数据的其他引擎,最后结果“为了获取完整结果您需要支付,5000美元 + 1万日元 + 1000人民币 ….“。没错对于需要付费的信息可以直接在引擎端直接付费。
场景三: 引擎输入《动感超人速成》,结果“离您最近的购书地点…,或者从以下途径网购“,不用填任何表单,只点了几下,一本书的网购完成。
好吧,举例结束,语义网对于用户而言只是获取信息更加的便捷和智能。而语义网的实现对于现在的工程师而言确是任重而道远。
语义网实现的关键
1. 数据和关系抽象
实现语义网的前提就是统一的数据描述格式,日志,照片,商品,软件,个人信息描述,列车时刻,等等这些信息都可以用RDF来描述
http://www.w3school.com.cn/semweb/index.asp
2 . 人工智能
数据被抽象成机器可以识别的RDF格式,而数据的检索和处理便需要数据处理引擎能够像人类一样的理解这些数据,你甚者可以把他们想象成12580的话务员,只不过这些机器的处理速度更快,而且它们不需要工资。语义网的智能还将体现在其他方面,比如避免重复信息,隐私信息安全和垃圾信息过滤。
下面是关于语义网的一些发散:
1. 语义网时代的google会怎样
不知道google还会不会一家独大,但是搜索引擎之间将不会再孤立。数据提供者一般会提供自己的搜索引擎,例如一个医药学的收费数据库,而通过任意一个搜索引擎查询医药学的关键词,都可以通过引擎之间的信息路由检索到正确的结果。而现在的互联网冗余了大量的重复信息,语义网的强大的信息路由功能使得信息不再需要存在多份拷贝。
2 . openid 会怎样
语义网使用者本身也将成为一个唯一的数据源放置在语义网上,这个rdf描述可能包含了你的个人信息,住址,也可能包含了指向你的blog,信用卡帐号等等外部资源的指针。你可以自己托管或者交给托管商托管,但无论如何通过信息路由,别人都可以找到你。通过这个唯一标示帐号你可以无须登录出入任何网站。
3 . facebook会怎样
Open Graph的推出使facebook越来越平台化,语义网时代的facebook将演化成一个社交信息推送和搜索引擎。facebook要做的仅仅是存储用户的社交信息,而用户的新鲜事可以发生在任何支持社交事件触发的网站或者应用。
4 . 语义网时代网站的盈利模式
以广告盈利为主的网站将微乎其微,用户将更乐意为有价值的信息和应用付费。
好吧,先想到这,发散起来确实没有边际,想实现细节更是想到头疼。。 也难怪砖家们现在也没怎么想好~
有时间继续发散。。