中国科普研究

中文
English

中国科普研究 » 学术专题 » 学术会议

学术观点|中国知网柯春晓:基于世界知识大数据的全球学术快报

文章来源:科普所 作者: 办公室 发布时间:2020-10-22 16:14

        导语:
        8月20日,中国科普研究所前沿系列学术报告第28期如期举办,本期报告人是中国知网副总编辑、高级编辑、知网国际总经理柯春晓博士,报告主题为“基于世界知识大数据的全球学术快报”。
        一、基本概念介绍
        1. 什么是好的知识服务平台?
        好的知识服务平台是全球读者依赖的平台,是可以一站获取的、一键查准、查全、查新的。
        平台需面向两个群体,一个是作者、期刊等媒体,另一个是读者。因此需要进行两个方面的工作,一是“聚资源”,要把全世界的资源聚到一起;二是“聚读者”。
        而“聚资源”、“聚读者”必须在平台上实现三个目标——快、准、全。“准”是基础,缺乏“准”的“全”只是堆积;同时满足“准”和“全”才能做到“快”;同时做到“准”、“全”、“快”,才能真正实现“一键查准、查新和查全”。
        1.1快
        传播快:最新内容排在前列,优先获取。
        出版快:与出版平台打通,出版内容第一时间发布。
        1.2准
        标注准:依赖规范的元数据标注。
        画像准:基于学术画像的精准推送。
        检索准:精准发现所需知识。
        1.3全
        检索全:跨语言检索,一种语言输入获取全球知识。
        收录全:全球知识资源在一个平台上统一获取与发布。
        2.什么是世界知识大数据?
        “世界知识大数据”综合国内外出版机构,在全球知名学术出版集团、国际知名学协会、国际知名大学出版社和主流小语种期刊平台与国内的期刊编辑部、报社、出版社、高校、协会等之间搭建平台。
        通过国内外多种机构的资源聚集,平台目前累计资源总量约5亿篇,平均每分钟更新166篇,平均每小时更新1万篇。
        3.世界知识大数据的三个层次
        “中国知网”运用智能化大数据的结构化与碎片化处理、知识化标注、知识体系化组织、知识关联关系挖掘等信息技术,形成了由全文作品与碎片化数据构成的“世界知识大数据”。“世界知识大数据”分为以下三个层次:
        3.1全文级大数据
        全文级大数据在文章层面形成数据,涉及元数据著录、主题词标引、国内外两级引文链接、国内外相关文献关联、文内专业术语链接。
        3.2段落级大数据
        段落级大数据以段落为单元形成数据,主要指段落主题标引、国内外一级引文链接、国内外相关文献关联。
        3.3知识元级大数据
        知识元级大数据提取并标引文中图形、图像、表格、表格、公式、概念、原理、思想、方法、研究对象、问题、思路、解决方案、过程、结果、结论、讨论、研究者、人物、地点、事件等内容。
        二、全球学术快报的用途
        全球学术快报是基于世界知识大数据搭建的平台。涵盖全球学术期刊7万种,有出版快,检索快的特点,并且检索默认按时间倒序。方便读者通过检索获得最新的信息。
        1.如何用知网平台去鸟瞰一个新的“知识领域”
        利用知网平台了解一个新领域,除了从当前静态断面的角度了解研究内容、研究者、研究方法和研究成果发表在哪些研究现状之外,还可以把研究主题在时间轴上展开,看研究起点、研究来源、研究分支、研究去脉,从而把握研究发展变化。
        2. 如何用知网平台“钻取”特定知识领域的研究点
        已经了解一个领域的概括,需要具化研究内容时,可利用知网平台钻取研究点。
        利用知网平台可以探寻学科交叉点
        平台上所有的文献都会被自动分类,把中外文文献按照统一的学科分类体系进行分类后,就可以直接在学科体系上找到学科交叉点。
        利用知网平台可以跟踪政策导向
        搜索领域关键词后,在边栏基金选项选中某基金,就可以查看该基金支持的研究主题。这样,可以更容易地找到国家支持的选题方向。
        利用知网平台可以找到热点中的忽视点
        高被引文章一般是研究的热点,高下载文章一般是关注度较高的文章,而“热点中的忽视点”寻找的目标是“高被引”+“低下载”。 另外,还可以利用关键词共享网络寻找热点中的忽视点。
        3.如何用知网平台选取精读的文章
        写论文或者做研究,最关键的是“问题意识”。选择精读文章之前,最关健的一步是确定问题。在确定问题的前提下,要精读经典文献、最新文献、大咖文献和名刊文献。
        经典文献可以通过平台引证网络分析,寻找中枢文献;通过被引排序,找高被引文献来获得。最新文献在知网默认主题相关条件下,会排在前列。检索大咖文献可通过作者导航、机构导航、学者圈、引文库等方式实现。名刊名会文献可通过名刊期刊的导航和指标检索到。另外,还可以按图索文,通过学术图片检索到该图片所在的文献。
        三、背后的逻辑
        1.数据层级
        平台数据分为4层,第一层是基础数据,包括文献数据、大量的实验数据、读者的行为数据、大量的统计数据等,这是在全球范围内采集到的基础数据。第二层是属性数据,在行内则称为原数据,是描述基础数据的数据。第三层是关系数据,如上下位关系、从属关系等。第四层是决策数据,是以其他平台数据为基础形成的知识图谱、趋势分析和决策依据。
        我们更希望能够在这些数据的基础上来完成趋势分析、知识图谱、决策依据。 
        2.逻辑算法
        知网平台会使用自己的标引技术对每一篇文献进行画像,标注主题词和关键词。读者在输入一个词之后,平台会对输入的词进行检索扩展,即用输入的词与扩展词进行匹配,实现中英的或者多语言的混合检索。
        过程中使用相关度算法模型,再进行排序算法,最终获得检索结果。
        延伸阅读
        [1]柯春晓:企业目前未成为创新主体 微观生态上有问题
        https://finance.sina.com.cn/meeting/2019-08-31/doc-iicezzrq2516530.shtml 
        [2]柯春晓.基于知识服务的科普期刊办刊模式研究[J].出版科学,2018,26(01):66-70.
        [3]张宏伟,宋菲菲,陶红燕,宋青.基于世界知识大数据的学术期刊出版、传播与利用[J].科技与出版,2019(06):79-83.
        [4]张丽华.知网节与知识网络[J].现代图书情报技术,2006(09):85-88.
        [5]王雪静,张丽. 基于碎片化的标准公共服务平台建设探讨[A]. 中国标准化协会.第十四届中国标准化论坛论文集[C].中国标准化协会:中国标准化协会,2017:4.
 
中国科普研究所
返回顶部
联系我们
手机访问
手机访问