文化图谱的意味和于物色着之张。边表示实体/概念中的各种语义关系。

 

其三栽文化图谱


知图谱本质上是平等栽语义网络。其结点代表实体(entity)或者概念(concept),边表示实体/概念中的各种语义关系。Knowledge
Graph
, Freebase , Wikidata 是时下不过常见的老三种植知识图谱。

Atitit
知图谱解决方案:提供整机知识系统架构的查找和知识结果overview

Knowledge Graph

Knowledge Graph
是Google的一个知识库,其采取语义检索从多自收集信息,以加强Google搜索的色。Knowledge
Graph

2012年加盟Google搜索,2012年5月16日专业颁布,首先可每当美国用。Knowledge
Graph

除了展示其他网站的链接列表,还提供结构化及详细的关于主题的消息。其目标是,用户以能使用此功效提供的音来缓解他们询问的题材,而不用导航及另外网站并友好汇总信息。

 

1.搜索api

Knowledge Graph 提供了查询api,官方文档见API
Reference。
可以一直利用HTTP GET进行查询,如运用以下url查询与 Fudan 关的实业:
https://kgsearch.googleapis.com/v1/entities:search?query=Fudan&key=
小心url中之key字段为开发者账号申请之api调用key。

文化图谱的意味与于搜索着之张1

2.查找结果

用户可指定返回的询问结果格式,json格式的内容如下:

{
    @context:
    {
        @vocab: "http://schema.org/",
        goog: "http://schema.googleapis.com/",
        EntitySearchResult: "goog:EntitySearchResult",
        detailedDescription: "goog:detailedDescription",
        resultScore: "goog:resultScore",
        kg: "http://g.co/kg"
    },
    @type: "ItemList",
    itemListElement:
    [
        {
            @type: "EntitySearchResult",
            result:
            {
                @id: "kg:/m/0jktd",
                name: "Fudan University",
                @type:
                [
                    "CollegeOrUniversity",
                    "Organization",
                    "EducationalOrganization",
                    "Place",
                    "Thing"
                ],
                description: "University in Shanghai, China",
                image:
                {
                    contentUrl: "http://t3.gstatic.com/images?q=tbn:ANd9GcRL6bWR-Z8BDYVYytbMaXJiTa8l690RY2pwpAbj7EvIlRgrDb97",
                    url: "https://commons.wikimedia.org/wiki/File:Fudan-logo.jpg",
                    license: "http://creativecommons.org/licenses/by-sa/3.0"
                },
                detailedDescription:
                {
                    articleBody: "Fudan University, located in Shanghai, China, is one of the most prestigious and selective universities in China, and is a member in the C9 League and Universitas 21. ",
                    url: "http://en.wikipedia.org/wiki/Fudan_University",
                    license: "https://en.wikipedia.org/wiki/Wikipedia:Text_of_Creative_Commons_Attribution-ShareAlike_3.0_Unported_License"
                },
                url: "http://www.fudan.edu.cn/"
            },
            resultScore: 40.484966
        }
    ]
}

其中 @id 字段为对应之entity在 Freebase 中的mid。

升级Google搜索效果3

3.api特点

优点:

  • 询问简单便捷
  • 询问结果可以指定为json等格式返回
  • entity中的多数音讯是一直展示在Google相关物色的右手栏wiki中的,质量比高而且相对比较丰富
  • 每个账户的免费额度也每天100,000次于查询,能够满足大部分运状况

缺点:

  • 未可知直接沾同该相关联的任何entity信息

1、找到最想念如果的音。3

Freebase

Freebase
是一个是因为长数据整合的大型合作知识库,内容根本来源于那个社区成员的贡献。它构成了好多网上的资源,包括一些私人wiki站点中之始末。Freebase
致力为打造一个许全球有人(和机器)快捷访问的资源库。它由美国软件公司Metaweb开发并叫2007年3月明白运营。2010年7月16日为谷歌收购。
2014年12月16日,Google宣布用以六个月后关 Freebase
,并以不折不扣多少迁移至 Wikidata

2、提供最好完善的摘要。4

1.搜索api

官方文档见API Reference。
可以直接利用HTTP GET进行询问,如应用以下url查询及 Fudan
相关的实业:
https://www.googleapis.com/freebase/v1/search?query=fudan&format=entity

3、让追寻更有深度和广度。4

2.招来结果

杰出的寻结果类似如下:

{
    "status":"200 OK",
    "result":
    [
        {
            "mid":"/m/0jktd",
            "id":"/en/fudan_university",
            "name":"Fudan University",
            "under":"Shanghai",
            "lang":"en","score":39.771729
        },
    ],
    "cursor":20,
    "cost":4,
    "hits":543
}

 

3.api特点

优点:

  • 询问简单便捷
  • 查询结果因为json格式返回
  • 每个账户的免费额度为每日100,000蹩脚询问,能够满足大部分动状况

缺点:

  • 无能够直接获取与那相关联的别样实体信息
  • 实体中可知一直用的信息比少

互联网刚刚自只有包含网页和网页中超链接的文档万维网(Document
Web)转变成包含大量叙述各种实体和实体之间丰富关系之数万维网(Data
Web)。在这背景下,Google、百度和搜狗等寻找引擎公司纷纷以这为根基构建知识图谱,分别吗Knowledge
Graph、知心和知立方,来改进搜索质量,从而延长了语义搜索的发端。下面我以由以下几单方面来介绍知识图谱:知识图谱的象征和当探寻中的见形式,知识图谱的构建与文化图谱在寻找中的利用等,从而让大家有机遇了解其内部的技艺实现与各种挑战。

4.翻看实体详细信息

虽然 Freebase
的实业查询结果中会直接用的音讯较少,不过好透过Freebase提供的网页查看相应实体的详细信息,只待以首页地址https://www.freebase.com后补充加上对应之mid就可知一直反问html格式的详细信息页面,如
Fudan University
的mid为m/0jktd,则该详细信息页面的url为https://www.freebase.com/m/0jktd。这使利用网络爬虫获取实体的详细信息成为可能。

文化图谱的表示与于搜寻中的展

 

办法的凡清晰的,没有呀秘密。楼上各位都说之非常清楚了:实体提取,关系提取,图谱存储和查找。

兑现一个大面积中文知识图谱至关重要有星星点点片段,以“美人鱼的导演是哪个”为例:

1.
建知识库。爬百度百科,解析网页,实体对伙同。知识库可以就此RDF表示:三元组(美人鱼,导演,周星驰),和对应的schema(movie,
movie_director,
person)。存储方发出多:可以Neo4j、MySQL,也得以自定义。抓取的网站更加多,歧义消除/指代消解之类的行越来越多,找质量好的网站可以看多行。半结构化的网页到结构化的多寡吧是同一老坑。

2.
询问了解。语义分析“美人鱼的导演是孰”
,得到句法树,生成检索语句(与相应的储存方对应:SparQL-Neo4j /
MySQL-SQL),检索知识库得到结果 “周星驰”。

笔者:满地好松果
 

 

Google在那法定博客中宣称:为了给用户会还快又简单的发现新的音讯及文化,Google搜索将揭晓“知识图谱”(Knowledge
Graph)——可以以追寻结果开展文化系统化,任何一个首要词都能博取完全的知系统。
比如搜索“Amazon”(亚马逊河),一般的探寻结果碰头受出与Amazon最相关的音讯。比如Amazon网站,因为网上关于其的信息最多,但Amazon并不只是一个网站,它还是环球流量最要命之Amazon河流。如果以追溯历史,它或许要希腊坤老总一族的代称。而这些结果未来还见面在Google搜索的“知识图谱”中见出。

 

为用户会再快更简短的意识新的信息与学识,Google搜索将通告“知识图谱”(Knowledge
Graph)——可以以寻找结果开展文化系统化,任何一个首要词都能获取完全的学识系统。

 

1. 找到正确的结果。由于一个根本词或代表多又意思,所以知识图谱会将最全面的音讯展现出来,让用户找到好最好想只要之那种含义。

1. 

最好好之总结。有了知识图谱,Google可以再次好的明亮用户搜索的音讯,并总处系的始末与主题。当你搜“玛丽·居里”时,你不仅仅可取得此要词之拥有有关内容,还会得到居里夫人的详尽生平介绍。

2. 

3. 

又甚、更普遍。由于“知识图谱”会给有搜索结果的整体知识体系,所以用户往往会发现许多不明白之东西(知识)。当你找一个即将去旅行的地方经常,可能您晤面发现一个因为之命名的饭店,甚至还可能发现尚时有发生相同以小说就是叫这名字,并且已改编成了同名电影。

4. 

Google的“知识图谱”不仅仅会起Freebase、维基百科或中外概览中取得专业的音信,同时还通过大的音讯搜索分析来增长搜索结果的深度和广度。现在Google数据库中含超过5亿只东西,不同事物之间的干越35亿久。同时人们找的逾多,Google获得的音信吗尽管越是多逾到,整个文化图谱也即会达成更好的效力。

当下Google的文化图谱会先打英文搜索开始,未来会面向手机平板等移动装备以及还多之言语扩展。欲询问再多信息,请走

5.Data Dumps

另外 Freebase 还提供整体的数据库下载,详情参见Data
Dumps。dump的数据吧元组的形式,实际使用起来有一定之挑战性。

升级Google搜索效果

编辑

Knowledge
Graph从以下三方提升Google搜索效果:

6.停止开放

欲注意的是,Freebase
不久用停止开放,详情参见ShutDown。

1、找到最好怀念只要之音讯。

语言或是含含糊糊的 —— 一个摸请求或代表多重复意思,Knowledge Graph会将信息到显现出来,让用户找到好最怀念使之那种含义。现在,Google能够亮当下其中的区别,并得以用搜结果范围缩小至用户最好惦记使的那种含义。

Wikidata

Wikidata
是一个而同步编辑的知识库,是接着2006年底维基学院之后,第一单新的维基媒体基金会项目。这同类别与维基共享资源的行事章程接近,将为外维基计划以及各国语种维基百科中之信息框、列表及跨语言链接等提供联合存放的多少,该型以2012年10月30日投入使用。

2、提供极致周全的摘要。

有了Knowledge Graph,Google可坐还好之知晓用户搜索的音,并总结发生和寻找话题有关的情节。例如,当用户搜索“玛丽·居里”时,不仅只是看出居里夫人的一生一世信息,还能够博得有关该教育背景和不利发现上面的详尽介绍。此外,Knowledge Graph也会见赞助用户了解事物之间的关联。

1.搜索api

官方文档见API Reference。
可以直接下HTTP GET进行询问,如用以下url查询及 Fudan 关的实体:
https://www.wikidata.org/w/api.php?action=query&list=search&srsearch=Fudan&format=json

3、让找还有深度和广度。

鉴于Knowledge Graph构建了一个与追寻结果相关的共同体的学识系统,所以用户往往会获取意想不到的觉察。在寻找中,用户可能会见了解及有新的真情或新的联系,促使该进展同样系列之新搜索查询。

 

所谓知识图谱听起来挺了不起上称为给电脑装及了大脑…其实无非就是是自各种结构化/半结构化/非结构化数据遭到抽取实体/实体性质/实体之间的涉及,构成一张图,这张图克体现真实世界的连带信息,因为实际的社会风气在人类的体味中就是出于实体、属性与实业间的涉及结合的

 

获得这些事物的极老挑战无非就是是实业识别、消歧(重名,别名)、实体关系掏等,这些算是都属nlp的问题

知识图谱_百度百科.html

 

Google发布“知识图谱”:为用户提供有整体知识体系之查找了果.html

(1 封私信 _ 2 漫长消息) 中文知识图谱构建思路是呀? – 知乎.html

 

作者:: 绰号:老哇的爪子 ( 全名::Attilax Akbar Al Rapanui 阿提拉克斯 阿克巴 阿尔 拉帕努伊 ) 

汉字名:艾提拉(艾龙),   EMAIL:1466519819@qq.com

转载请注明来源: http://www.cnblogs.com/attilax/

Atiend

 

 

 

2.摸索结果

独立的追寻结果类似如下:

{
    "batchcomplete":"",
    "continue":
    {
        "sroffset":10,
        "continue":"-||"
    },
    "query":
    {
        "searchinfo":
        {
            "totalhits":17
        },
        "search":
        [
            {
                "ns":0,
                "title":"Q495015",
                "snippet":"universit\u00e9 Fudan-universiteit",
                "size":17783,
                "wordcount":253,
                "timestamp":"2016-01-06T21:09:34Z"
            },
        ]
    }
}

3.api特点

优点:

  • 询问简单便捷
  • 询问结果可以设定为json格式返回
  • 从不询问额度限制

缺点:

  • 匪可知直接沾同那个相关联的任何实体信息
  • 实体中会一直动用的音于少

4.获取entity详细信息

除了提供实体查询接口,Wikidata
还提供了专门的api用于通过实体的id获取实体的详细信息,这些信包含与该相关联的旁实体信息。
此api可以以结果因为多种格式返回,例如为HTTP
GET的章程获取id为Q495015之实体的详细信息并指定为json格式返回的url为:
https://www.wikidata.org/wiki/Special:EntityData/Q495015.json
此外还可以一直通过html方式示实体详细信息,例如:
https://www.wikidata.org/wiki/Q495015

5.Database Download

Wikidata 提供完整的数据库下载,详见Database
Download

对比

项目 Knowledge Graph Wikidata Freebase
额度 10万/天 不限 10万/天
查询结果中能直接利用的信息 多,大部分信息都会放在Google相关搜索的右侧wiki栏 很少(只有name和id) 很少
数据获取 在线api 在线api + data dump 在线api + data dump
获取关联实体 查询能得到实体在freebase中的mid,通过此mid获取相关实体 可以直接查询实体详细信息得到关联实体 通过dump的数据离线分析(复杂)或者爬虫分析实体详情页面
维护 Google Wikipedia 不久将被shut down

相关文章