欢迎访问冯晓青知识产权网! [请登录], 新用户?[免费注册] 设为首页|添加收藏|联系我们|网站地图|English
当前位置:冯晓青知识产权网 > 国家社科基金重大项目 > 历次学术研讨会 >  文章

第二次学术研讨会

来源:冯晓青知识产权网  作者:  时间:2012-09-22  阅读数:

2010年度国家社会科学基金重大项目(10&ZD133

“国家知识产权文献及信息资料库建设研究”

第二次学术研讨会

国家知识产权文献及信息资源

建设现状及数据库构架研究

会议记录

举办:中国政法大学无形资产管理研究中心

 

2011123于北京

第一阶段:开 幕

主持人:张今,中国政法大学民商经济法学院教授

主持人:

今天我们是在这里举行由冯晓青教授主持的国家社科基金重大项目关于国家知识产权文献及信息资源建设现状及数据库构架研究第二次学术研讨会。非常感谢各位专家牺牲周末的时间来参加本次会议。首先我们请这个项目的主持人冯晓青教授给我们介绍一下本项目的研究进展、研究现状和本次研讨会的议题。大家欢迎!

 

冯晓青教授

大家上午好,非常高兴也非常荣幸地邀请到在座的各位,尤其是远道而来的各位专家及专利局的曾部长来参加这次会议。首先请让我先介绍一下今天各位来宾的情况。

这位是曾志华部长,他是国家专利局专利文献部的部长,非常感谢曾部长能来参加我们的这个盛会。

这位是远道而来的哈尔滨工程大学知识产权法研究所所长张冬教授。

下面这位是武汉大学信息管理学院的冉从敬副教授,冉教授也是知识产权和情报分析方面的专家。

这边是农业部农业管理干部学院的贺利云博士,她在植物新品种方面有着一定造诣。

这位是我们自己研究所的刘瑛副教授。

这位是湘潭大学法学院、知识产权学院副院长,博士生导师肖冬梅教授。

下一位是在文献和数据库标引方面做了大量研究的文庭孝教授,文教授来自湘潭大学公共管理学院。

这边是来自武汉大学信息管理学院的吴志强副教授。

再下一个是李喜蕊博士后,负责的是国内外知识产权网络信息服务现状及启示这一块的研究。

这边是赵秀姣,是北京交通大学图书馆信息咨询部馆员。

这边是我们知识产权研究所的郑璇玉副教授。

这位是我们本校的图书馆副馆长,欧阳晨红研究官员。

这位是国家知识产权局专利复审委员会诉讼处的何伦健。接着是湘潭大学公共管理学院副教授仇壮丽博士。

这位就是我们的主持人,中国政法大学的张今教授。

下一位是我们知识产权研究所的陈丽苹教授。

再下一位是我们知识产权研究所的杨利华副教授。

这一位是中国政法大学科技教学部副教授王宝珠。

接着是湘潭大学法学院的胡梦云副教授。

坐在后排的主要是我现在指导的博士、硕士生,还有其他老师指导的研究生,就不一一介绍了。还应感谢邓毅沣博士,这次会议主要是由他具体负责会务的。这些博士硕士们为了本课题也付出了大量辛勤的劳动。

这是我介绍了一下今天来参见会议的专家学者,让大家相互认识一下。很难得大家有机会聚在一起交流学术意见。下面我就项目研究进展及本次研讨会的议题作一下简单的介绍。这个项目是20101228号被批准的,到我们这个研讨会召开,刚好过去了将近一年。在这一年的时间里,我先给大家汇报一下我们所做的工作。首先我们在全国范围内开展了有关知识产权文献及信息的调研工作,问卷我们设计了四个版本,即公众版、实务版、专业版、学生版。这四种版本有一部分内容是共同的,另一部分则是针对不同的对象设计了不同的题目。题目中大部分是客观题,有单选、多选及开放式选择,还有少量的主观题。主观题主要集中在有什么建议等开放式题目上。回收的有效的问卷有7000余份。对于回收的问卷的整理分析正在进行,今天只是给大家汇报一下初步的成果,后期我们将以这些问卷为基础作出一份翔实的有价值的报告出来。

前期我们做的第二项主要事情是对这个大课题进行了整合。原计划是将大课题分为7个子课题,后来又增加了2个,所以一共是9个子课题。这些子课题涉及的版块主要有:1.知识产权领域规范性法律文件,包括法律、行政法规、部门规章、地方性法规、司法解释,另还收录知识产权政策性文件;2.知识产权司法判例;3.知识产权机构,有法院知识产权庭、知识产权行政管理机关、高校和科研院所知识产权机构、知识产权商业性单位,如知识产权代理机构;4.知识产权确权,包括专利申请与授权、商标注册申请与核准、计算机软件登记、集成电路布图设计登记、植物新品种申请与授权等;5. 国内外知识产权数据库及知识产权网站;6.知识产权学术资料,如论文、著作(含知识产权博士和硕士论文库),以及知识产权重大事件等;7.知识产权经营与资本运营等方面,有知识产权许可、转让、质押融资等;8.知识产权各类课题。当然,还有一些专题需要进一步补充,比如大家可以看到准备的资料里面有一份是知识产权的“十二五”规划,我们的课题内容大体上是与这个规划是吻合的,但是在非物质文化遗产、传统知识、地理标志、植物新品种等方面之前没有纳入课题研究范围,以后可能要进行补充研究。目前这些子项目是分了不同的团队在做。这些团队目前主要是在做基础资料的收集与整理筛选工作。以法律法规为例,目前我们收集到的各项知识产权法律文件共有4000余个,并进行了分类整理。另外,知识产权博士硕士论文的题目、摘要收集整理分类工作也已经基本完成。国内外的知识产权网站收集也取得了很大成绩。当然这些都不是最终的成果,不同的项目完成的程度不太一样,进度快的已经有了成果出来,今天将会有一些成果的展示。请各位专家听完报告后分析一下课题研究的不足并给出宝贵的建议和意见。本来还有一部成果论文集要展示,主要是时间太过紧张,没有制作出来,那就等下一次研讨会时再给各位专家展示这一部分的成果。

关于研讨会的议程,大家手上都有了一份详细的介绍文件。今天的会议主要是承上启下的作用,目的在于总结前面工作的成果的基础上,对后一阶段工作进行一个宏观性的规划。今天的研讨会分为两个部分:第一个是主题演讲,本来是邀请了四位专家,后来由于天气原因有两位专家不能到会,所以这个部分主要由曾部长和肖冬教授两位专家进行演讲。第二部分有四场研讨会,分别由主持人、演讲嘉宾、评议人进行发言。内容包括了国家知识产权文献及信息资料库建设原则与方法、国家知识产权文献及信息资料库模块设计与技术实现、国家知识产权文献及信息资料库建设现状调查与展望、国家知识产权文献及信息资料库建设专项研究四个方面。

以上就是我给大家简单介绍的我们前期的一些成果,谢谢大家!

主持人:

谢谢冯晓青教授给我们作的介绍,说实话我也没有实质性的参与这个课题的研究,但是冯老师觉得自己不能自导自演,所以就要我来作主持人(笑声)。下面我们就开始今天的研讨会。第一位演讲的是我们的曾部长,他演讲的主题是我国专利文献、信息及其数据库建设的现状,大家欢迎!

第二阶段:主题演讲

主讲人

曾志华,国家专利局专利文献部部长(我国专利文献、信息及其资料库建设现状)

肖冬梅,湘潭大学法学院副院长,教授、博士导师(国家知识产权文献及信息资源现状分析和研究)

内容纪要:

曾志华部长:

很高兴受到教授邀请参加此次交流活动。希望介绍的内容能对课题有所帮助,不虚此行。

从专利局的文献资源方面进行简单介绍,演讲的内容主要包括三个方面:已经做了什么,现在做什么,将来做什么。

专利局建立30年多年,在30多年的发展历程中 ,全国的专利文献资源方面的建设取得了比较大的成就。有以下几个特点。

第一,资源的种类和总量建设处于全球领先地位。目前专利据收录全球62个知识产权机构(涵盖102个国家),382种文献资源,文献总量至少有七千万件。专利合作条约(以下简称PCT)要求,国家如果申请承担PCT初审和检索,要求文献量的最低标准是涵盖12个国家5个组织的文献。我国文献量远远超过了PCT要求的最低标准。中国成为第13个建立PCT文献范围的国家,也是建立PCT文献的第一个发展中国家,同时标志着我国专利文献在全球产生了影响。以后其他国家检索专利文献时,需要检索中国的专利文献。中国的创新在全球得到认可。信息的存储量超过100TB

第二,资源结构比较完整,资源保障支撑比较健全。包括题录数据、全文数据。全文数据有文本和PDF格式,分布结构合理。数据来源有三大保障渠:有国际交换、商业交换和自主加工。由于现在知识产权行业标准数据滞后于产生的时间点,所以很多国家的数据标准不一致,例如内容、字段、显示形式、运行系统不一样。如果要整合到一个大的平台,就需要自主的加工。中国专利局和其他国家局相比,投入相当大,与全球领先的欧洲专利局、美国专利局差距相对小。

第三,资源管理科学,资源的管理比较深入,基础建设进入全球领先行列。在数据分析方面,由于各个国家的数据标准不同,如果进行有效地检索,就需要对结构解析。十一五期间发布两个国家标准:知识产权文献信息化的授予标准和分类标准。行业标准由知识产权局牵头,有20多个标准,进行数据加工和标引。我们开展了17个项目的加工。加工对象既包括专利文献,也涉及到非专利文献。创新之处是深度加工,深度加工的内容包括国际分类专利号、摘要、主题词、引文、对属于法人的申请人的代码进行更新。此项目是其他知识产权局没有进行过的。同时,在资源管理方面,建立了数据监控机制,有抽样规则和完善的管理,建立了相关档案和文献资源的综合管理平台。资源服务和应用方面取得重大突破。在十一五之前,有两套专利检索和服务系统平台,一是针对中国国内专利文献的中国专利查询系统,从单机版扩展到网络版。因为当时的信息理念没有渗入到政府机构。现在,专利文献队伍从不到1000人发展到5千多人。专利申请量逐年增长。另外一个是引进的欧洲专利局检索系统。十一五期间,把两个系统整合成一个大平台,包括34个数据库,涵盖62个机构,102个国家, 9千万件文献。我们现在还有知识产权文库。学术文章、报刊、法律法规、会议记录、技术标准、国家政策也全部被包含进来。以此系统为龙头,配以以前8大专业系统,形成了完整的专利文献资源的检索服务平台,对内代号为S系统,对外称专利检索和服务平台。由于外观设计的检索是以图片展示内容,与文本检索有很大差别,因此“十一五”期间建立了专门针对外观设计的检索系统,处于世界领先水平。专利申请涉及很多技术领域例如化学、生物领域,针对不同领域,建立了专业的检索系统。从欧洲专利局引进的欧洲专利局检索系统仍然使用。因为,从使用旧的系统到使用新的系统存在过渡阶段,并且针对国外的数据更新,国外系统自身更新速度快。这些方面的完善,对于政府履行公共服务的职能提供了保障。

第四,由于政府机关履行自己职能,同时履行公共服务功能,我国目前建立的专利检索平台有3个层次。一是知识产权局的门户网站,年访问量在97个部委的网站排名中处于前20名。二是与S系统对应,部署了两套系统:对内局域网、对外公共网。数据一样,但是检索策略有所差异。对外更普及,对内更专业。对外还包含专利分析工具。第三个渠道是面向重点产业的信息服务平台。由于内部人员理念不同还没有建设数据库,但是地方政府非常希望国家能够建设这一平台。我国面向重点产业的信息服务平台与国外的理念不相同。国外的主要是提供基础数据,借助商业机构来建设。例如美国专利局和Google签署协议。我国主要是国家建设。

第五,从推进的角度提出三级架构,正在建设中。产业平台和地方平台正在建设。例如广东和上海在建设地方服务平台的投入很大。三级架构包括构建全国性的数据中心,5个区域信息服务中心,47个地方信息网点。国家数据中心起总控作用。区域例如长三角和珠三角地区面向本区域。地方网点主要针对地方特色,结合企业、产业和创新来打造。推向全球,网站是一种很好的手段。面向国外有机器自动翻译系统,比较完善,准确率达到可读程度,对摘要的翻译水平相对较高。另外,关于深度。建立了50多个非专利系统,例如Westlaw-法律系统,CA-化学系统。

下一步进展主要有以下六个方面。1、强化资源保障,扩大资源的来源。2、推进专利文献体系和三大文献体系相融合。三大文献体系包括科技文献体系、高校文献保障体系和公共图书馆。要加强它们之间的职能融合。第二个是要进一步加强平台建设,更多地采用机器翻译,因为人工加工成本较高。在自动标引和自动分类的基础上进一步实现智能检索和分析。3、平台建好了,如何发挥作用。加强传播,利用宣传培训来促进传播。建立分领域的检索模板。目前已建立33个技术领域的检索模板,利用这些模版分析发展态势、竞争点。4、中国的特色与国外不一样,对于怎样建设平台有不同看法,要支持鼓励社会力量参与建设,转变政府的职能,政府承担宏观管理和支持的责任。5、最后政务信息的整合。整合政府信息能提供更好的服务。针对政府的内部刊物和报告存在保密和解密的问题。但是有些政府信息可公开,这就需要利用这些政府信息为社会服务。6老师时刻关注知识产权领域的最新形势,准备的资料很有意义,对课题研究有很大的参考价值

主持人:非常感谢曾部长的演讲!曾部长的演讲信息量非常大,使我们收获颇丰。下面欢迎肖冬教授发言。肖教授演讲的题目是国际知识产文献及信息资源现状与展望——以我国专利信息资源保障系统建设为例。

肖冬教授:

大家上午好,非常荣幸与大家一起探讨,曾部长站在知识产权局的角度给大家做了一场精彩的讲座,我主要讲我的副标题。曾部长从政府角度展开,我从消费者角度来看这一问题。

内容有:我国专利系统信息与利用现状;我国专利信息资源保障系统、构建、专利信息开发;相应的制度安排。

首先介绍一下专利信息资源系统现状与问题。专利信息增长迅速、数量庞大,是亟待开掘的宝藏。由于专利信息的价值具有时效性,企业需要及时的专利信息,而政府提供的信息难以满足企业的需要。因此专利文献的信息化是在浩如烟海的信息中高效获取精准专利信息的必由之路。科学合理的专利信息资源保障很有必要。我国有必要建立知识产权法的基础设施。

从开发的程度看,分为基础初始开发和增值深度开发两种。我国专利文献检索平台有三级架构,企业有自己的平台,在这三级平台架构下,存在很多浪费性建设。目前中国增值开发和利用力度较弱,满足不了企业的需求,其经济效益和社会效益远远没有发挥出来。华为法务部部长提出专利地图就是作战地图。从幻灯片上可以看出专利地雷阵/壁垒。在这样的环境中,尤其对企业来讲,就需要深度加工。从专利地图中可以看出企业采取不同的专利策略,如专利围剿策略和专利防御策略。而这些策略的数据通过公共平台是很难获得的。

另外,因为审查过程的数据没有公开。导致了解竞争对手的情况非常困难,没有数据支持是很难实现的。我国提供同族专利的数据分析,但是缺乏人工的分析,人工交易的数据无法得到。从全球风电领域重要专利权人成长图可以看出很多公司具有强大的资本能力,而缺乏专利,就可以通过收购来得到另外一个公司的专利。例如收购安然公司案,在专利分析时有一些商情数据得不到。

专利侵权分析——后三代引证分析。通过调整相似性,来控制筛选出来的数量。专利无效分析——前三代引证分析。通过相似度查询的相似案件,可以很容易找到专利无效的证据。高效获取核心专利。从申请到授权、诉讼量、诉讼费用,进行加权分析,迅速找到最核心的信息。我国政府很难提供这一服务。专利信息资源保障系统的建设是充分发挥专利信息资源经济利益和社会利益的基础和前提。我国参与国际竞争,必须完善相关基础设施。此设施就是专利信息资源保障系统。

老师的课题建设在制度层面要首先考虑资源保障系统能够运行起来。

国家公共信息资源保障系统的整体构想:专利信息数据库、商情数据库、专利诉讼信息数据库。构建分布异构的国家、区域行业组织与企业三级联动的专利信息资源保障系统。第一层:国家公共基础专利信息资料库,满足基本的专利信息需求。第二层:区域行业协会产业专利信息资料库。在第一层的基础上,针对具体产业进行二次开发(国外专利摘要和权利要求书的翻译),建立产业专利资料库建设,避免企业资源不必要的浪费。第三层:企业产品专利信息资料库,针对自己所处的产业和生产线来详细建设。第一层应当由政府来负责,数据要求全面、准确,公开审查过程中的数据。第二层由各个地方知识产权部门和行业协会来协调。

根据以上的分析,我建议我们应建立知识产权服务市场。制度完善应从三个方面来:专利信息的公开制度、市场一体制度、信息产权安排和许可制度。

 

 

 

 

 

 

 

 




第三阶段:专题研讨会

第一场国家知识产权文献及信息资料库建设原则与方法

主持人:陈丽苹,中国政法大学民商经济法学院教授

主讲人

一、文庭孝,湘潭大学公共管理学院教授(国家知识产权文献与资料库的标引原则与方法)

二、冉从敬,武汉大学信息管理学院副教授(知识产权信息增值开发的数据库的系统架构)

三、吴志强,武汉大学信息管理学院副教授(法律资源数据库建设现状与启示)

评议人:

欧阳晨红,中国政法大学图书馆副馆长、研究馆员

胡梦云,湘潭大学法学院副教授

内容纪要:

主持人

我们现在进入到第三阶段专题研讨会,第一位发言人是文庭孝,他是湘潭大学公共管理学院教授,发言的题目是《国家知识产权文献与资料库的标引原则与方法》。有请文教授。

文庭孝教授

关于文献和资料库标引方面我做一个简单的汇报,这里有很多专家,我算是抛砖引玉了,讨论的时候大家可以一起学习。

标引主要涉及标引的对象,从知识产权文献资料看,可以分为两个部分,一是一般的文献,比如说期刊论文、报纸、会议论文,一般的文献和其他专业的标引方法、规则是相似的,另一部分像知识产权司法判例、法律法规等资料文献结构有很大的差异所以标引有特殊的要求。我主要从以下几个方面讲一下标引:标引的内涵、标引的类型、标引的原则、标引的方法。

第一部分:标引的内涵。

现实生活中的存在着几大矛盾:信息呈爆炸式增长和信息需求特定的矛盾,信息杂乱无章和信息有序化需求的矛盾,信息查找困难和信息查找方便需要的矛盾。对于这些矛盾的解决就需要标引,使信息有序化,这样才能更快的找到信息,有效的查询和获取,信息必须经过精心组织才能有效检索,标引是信息组织与信息检索的重要环节。标引是连接信息组织和信息检索的桥梁。简单的说字典的编辑就类似于文献的编辑,如果字典是没有序化的汉字组织体系(音序、部首、四角号码),我们就不容易找到需要的汉字。信息组织的目的是序化信息,把信息组织成有序的系统,便于存储和检索。信息检索的目的是从序化的信息体系中查询需要的信息。

具体到标引,标引是一个过程,标是标识或标记,引是指引,标引就是通过标识或标记指引人们方便、快捷地找到所需要的信息。在数据库中,也是一样的,标识或标记就是文献的外形特征和内容特征,也称检索途径。标引都是结构化,还有非结构化的需要处理成结构化地。简单地说,标引就是用检索标识/标记描述或表达信息的过程。标记文献法律法规的等,对其进行总结。通俗的讲,标引的过程类似于我们取名,先给每个人一个姓和一个名字,然后用姓名作为标识/标记识别、区分和查找人。取名的过程就是标引,找人的过程就是检索。专业的讲,标引的过程就是通过对信息的分析,选用确切的、显著的检索标识(如分类号、标题词、叙词、关键词、人名、地名等),用以反映该信息内容的过程。所以在信息检索过程中,标识即信息识别、区分标记,我们怎么去检索海量的资料,我们就是根据信息特征做标示和标记区分不同的信息。标识也称信息检索途径、检索项。

我们所说的标识主要分为以下几个类型:

——分类标识:数字(国际十进分类法、人大法、科图法)、

    字母、混合(中图法)

——主题标识:主题词、关键词

——其他标识:人名、地名、机构、化学分子式、期刊名称等

——专用标识(专业人员使用)和通用标识(普遍用户使用)

标识系统主要有以下几种:

——分类语言:分类标识

——检索语言:主题标识

——检索途径:其他标识

 我们来看一下主要的标识系统:标引标识亦称为检索途径,主要来源于信息的外形特征和内容特征。这是我们平时使用文献的一个主要区分标识,信息的外形特征有题名、著者、出版社、出版时间、出版地、开本、装帧、语种、机构等等还有比如专利有专利号;信息的内容特征反映了我们要查找资料的基本内容,这一部分来至于文本结构,包括比如主题词、关键词、摘要、提要、前言、目录、正文、注释、分类号等。标识在标示的过程中作为我们查找文献的指引,事先要有一个完整的标识描述系统。有一些标准来对标识进行规范,主要的录著标准有:九大著录事项,《英美著录条例》、《文献著录总则》。

 二、标引的类型  

一是分类标引与主题标引,分类标引:用分类标识(分类号)描述或表述信息的过程。其中主题标引是指用主题标识(主题词或关键词)描述或表述信息的过程。主题标引是指用主题标识(主题词或关键词)描述或表述信息的过程。二是手工标引和自动标引。手工标引是指人工赋予检索标识的过程,自动标引是指用计算机事先编制好的程序自动赋予检索标识的过程。我们下面要讲的标引主要是自动标引。

三、标引的原则

标引的过程中需要遵守一定的原则,第一个是优先使用唯一标识标引原则,如分类号、ISBD等,类似人的身份证号,具有唯一性,容易识别查找。第二个是尽量使用显著的标引,如题名、著者、主题词、关键词等,类似人的姓名,虽然有同名情况存在,但也容易识别和查找。另一个是有效使用组合标识标引,在一个标引无法识别时可以使用多种标识组合标引,也可以使信息标识具有唯一性。如题名+著者+机构+地区。总的来说标引的过程要做到做到标准、完整、准确、深人,同时要提供多条检索途径、多个检索入口。

四、标引的方法

关于标引的方法主要有赋值标引和抽取标引。赋值标引方法标引时用事先编制好的标识系统描述或表达信息。第二个是抽取标引,标引时从结构化或半结构化文本信息中抽取特定的标识描述或表达信息。所有的标引标识(特征信息)都包含在这三个部分之中,一个是物理结构一个逻辑结构还有内容结构。这三个结构组合在一起就形成了我们通常说的文献,如图书期刊之类的,三个基本结构我们把它细化,每个部分都有个基本结构,可以从结构中抽取关键作为标识。比如物理结构它由一系列的元素构成,具体情况如下:

信息的物理结构={题名,著者,机构,基金资助,摘要,关键词,分类号,正文,参考文献}

著者信息的物理结构={姓名,性别,出生年月/年龄,学历,职称,职务,研究方向}

关键词信息的物理结构={关键词1,关键词2,关键词3,…,关键词N}

正文的物理结构={引言,一级标题,二级标题,段落,句子,词汇,单个字,结论}

参考文献信息的物理结构={著者,题名,刊物名称,发表年卷期,页码}

  我的发言完了,谢谢大家

主持人谢谢文教授的发言,第二个发言人冉从敬,武汉大学信息管理学院副教授,他发言的题目是《面向知识产权文献信息增值开发的数据库系统实现构想》

从敬副教授:

我的题目是《面向知识产权文献信息增值开发的数据库系统实现构想》主要包括以下几个方面:第一、合理化及基本现状;第二国际制度与实践;第三制度需求;第四技术需求;第五、关键技术构想。

  1 合理性及基本制度

  1.1增值利用的界定与表现形式

1.2增值利用的主要原因 

第一我国知识产权的数量已经相当庞大,但效率还有待提高;第二初始状态的知识产权文献信息通常处于一种零散、无序、彼此独立的状态,既不便于传递、分析,又不便于开发利用;第三现代的相关技术也提供了一定的可行性。

1.3增值利用的主要意义

第一提高了公共部门信息利用效率,实现了资源的价值增值;第二个知识产权文献信息增值利用有利于社会公众获得更多个性化知识产权文献信息产品;第三有利于推动知识产权文献信息资源开发利用的有序进行;第四有利于知识产权文献信息的产业发展。第五可以帮助人们进行科学检索。

1.4增值利用的表现形式

渠道(1)教学服务平台

我认为在知识产权教学服务平台方面可以将知识产权信息库和高校知识产权教学结合起来,可以根据教学需要进行深层标引,将法律条文、案例、法律研究文献、法律文书通过系统集成在一起,为知识产权的教学提供立体化的资料体系。

渠道(2)专家咨询平台

整合建立知识产权服务系统,将法学教授、律师从业人员、企业相关从业人员联系起来,建立一个人员之间的调度系统。

在相关咨询问题出现以后,系统接受到问题之后,对问题进行分析,结合用户的职业、提问风格、工作任务、用户日志等理解出用户的问题实质,然后根据该问题寻找合适的专家,在专家难以回答这个问题的时候,专家可以通过系统转发调度到其他适合的专家,如果没有专家可以回答,可以建立专家问答的公共征答区,在专家无法回答的时候,可以在保护隐私的情况下,建立用户的问题回答征集区。这一些需要在数据库的基础上建立专家库、知识库和完善的调度系统。     

渠道(3)专利分析平台

可以对专利文献进行语义分析、无效分析、侵权分析、引证分析、分类分析、过期专利分析。专利分析平台有利于企业确定合理的专利战略。

专利无效分析根据专利的相似度检索比对给用户有价值的建议;专利引证分析可以更好的了解专利类似主题之间的关联;过期专利分析可以为企业充分利用过期专利价值提供技术支撑。

渠道(4)自助办案平台

可以将知识产权数据库扩展成自助办案平台。针对律师、法官、检察官、公众服务。可以按照诉讼程序的各个阶段设置自助模板,提醒用户在相关时间点需要面临的未来程序、可能风险、基本文书、主要常识、已有案例、所涉条文、相关分析等,对于提高办案的工作的效率和科学性将有极大的提升。

渠道 (5)  业务洽谈平台

可以将知识产权数据库扩展成业务洽谈平台,提供合同模板样本,设置合同签署程序,进行一定的业务风险分析,例如可以在签署专利入股或者技术交易的业务中,程序能够自动查询该专利的法律状况,包括是否过期、是否临近过期、是否可能被宣布无效、和其他专利是否具有可替代性等,将减少交易时的盲目性,提高交易效率。

渠道(6)定题跟踪平台

可以根据知识产权数据库将之扩充为定题跟踪平台。根据相应的委托合同,参与知识产权的保护、投资、管理、教学和国家的宏观知识产权战略中相关课题。这些课题的研究需要相应的文献信息支撑平台,该平台通过持续性的文献跟踪、分析、定量统计等进行课题辅助。特别是定量分析对于确定当前的热点和主流思想很有帮助。

渠道(7)查新检索平台

可以将知识产权数据库扩展成具有一定查新检索的平台。可以为专利申请可能性进行预先的检索,可以为课题是否具有可研究性提供信息支持。

渠道(8个性定制平台

可以利用RSS技术进行个性化信息定制和推送。可以开辟个人注册空间,该空间存储个人提交的咨询问题,利用该平台进行业务交易的记录,个人定制的知识产权文献等信息,可以加大普通用户或者专业用户对于该系统的依赖性,从而提高流量和利用率。

渠道(9专题分析平台

可以利用该系统进行主动型的专题分析,瞄准目前国际国内的重大实践,瞄准企业的急需的问题,利用系统的信息统计或者深度检索进行分析。

2 国际实践与制度

国际制度方面主要看美国和欧盟:

1) 美国的实践和制度

2) 欧盟的时间和制度

2.1美国

美国的产品大家也比较熟知,这几个都是做的不错:Thomson  innovation;  Innography;

LexisNexis;  Westen law;  Heinonline.

  产品1Thomson  innovation,拥有2000多万条基本专利;覆盖近50个国家和地区的专利;追溯到1963年,每周更新两次;每周更新超过20,000篇专利。还有一些增值的功能:检索结果中,一个记录代表一个专利家族,可以节省大量阅读时间;利用手工代码和公司归类提高准确性;利用专利信息提高公司研发能力;利用自动预警提示风险;利用专利法律状态指定不同应对策略;结构化分析和专利引证分析;收集科技文献和商业新闻中的宝贵信息。

产品2 Innography

实现了专利检索和商业智能分析工具高度整合:相似度检索帮助提高检索效率,同时可进行相似专利检索;简单明了地展现专利强度的自动标引;由可视化分析帮助清晰呈现技术领域的竞争情报;支持导入Dialog等外部专利检索结果,并加以分析。

其他数据库:美国的知识产权文献信息增值利用是比较成功的。美国的知识产权文献信息可以分为原始文献信息、二次文献信息和检索工具。原始文献信息方面比较典型的包括:官方出版物为《United States Code》和《United States Statutes at large》,民间出版物为《United States Code Annotated,United States Code Services》。另外,对于最新法律、实施细则、总统命令和公报在《Federal Register》和《Code of Federal Regulations》上有发表。二次文献资源典型的包括:法律百科全书、法律重述(Restatements)、法学期刊、美国法律报告(American Law Report)、专论、统一法典等;在法律文献的检索上有引证(Citator)、WestlawLexisNexisHeinOnline等数据库等。此外,还有数量庞大的网站提供服务信息的查询和服务。

美国的政策: 美国在知识产权文献信息增值利用方面的成功和其相关制度体系是密切相关的。它对信息开发是有限制的,主要由企业做,这个不同于欧盟也不同于中国。与法律信息增值利用相关的制度包括:版权法、信息自由法、电子信息自由法修正案、阳光下的政府法、文书削减法、A130号通告等相关法律法规和政策。同时,政府主要通过协调机构、经济杠杆、竞争机制、税收政策等措施确保私营机构在知识产权文献信息增值利用中的作用。美国知识产权文献信息增值利用的良性发展与其健全的信息公开与获取制度是分不开的。

2.2.欧盟

  欧盟对信息数据库非常重视,有专门的指令叫公共部门信息的暂定指令,对法律法规等的信息进行深度开发,做了很多报告,每个月都有,特别是英国制定了相关的机构和程序。       

1999年,欧盟委员会发布《信息时代公共部门信息的绿皮书》,对包括知识产权文献信息在内的公共部门信息的商业价值以及如何进行商业开发进行了一系列探讨。

2000年欧盟委员会完成了《欧盟公共部门信息的商业开发》的报告。

2003年欧盟通过了《公共部门信息再利用指令》,以指令形式确立了增值开发的相关制度。

英国通过相关的法令、制定了相关的程序、成立了相关的机构、颁发了相关的解释性文件,推动信息的增值开发。

3.制度需求

3.1  信息范畴的界定

知识产权文献信息库的首要问题是确定其信息的收录范围,因为知识产权文献和其他文献常常有交叉之处。也有很多文献包含了有关知识产权的片段,但主题内容并不是关于知识产权的。知识产权和其他法学部门的关系也难以分割。因此要确定信息收录范畴,要明确知识产权文献的基本特征,根据其标题、摘要、关键词和全文等来确定其是否属于知识产权。

3.2  基础信息的获取

目前已经存在大量的法律数据库,如北大法律信息网、北大法意网、中国法学网等。如何处理该数据库和其他库的关系?是否能够合作或者套录数据?是否可能购买他们的原始数据?是否能够自动进行网络资源的采集?是否能够建立类似GOOGLE的站内站外检索系统?是否具有对于知识产权数据的增值开发的权利?开发知识产权研究文献的全文数据库系统是否可能?如何解决版权问题?这些都是属于基础信息的获取问题,需要利用相应政策作出明晰的响应。

3.3  信息质量的控制

知识产权数据库会涉及到大量的公共信息,欧美对于公共信息增值开发的质量做了很多限制,如何控制录入数据库的信息质量,如何保证通过网络资源吸收系统或网络搜索引擎得到的相关文献具有准确性、完整性、权威性、及时性、客观性等特征,需要相应的对策。

3.4  信息市场的协调

数据库开发增值信息服务,可能遭遇到政府部门自己开发增值服务的市场竞争。

在公共信息增值开发领域,美国、欧盟和中国的政策制度相差很大,总的来说,美国属于禁止公共开发,鼓励私营开发;欧美属于允许公共和私营都开发;中国在私营开发方面仍有限制,属于有限制的私营开发,整个市场培育制度还不健全。

根据近几年欧美的报告,公私并存开发存在一系列市场协调的问题,否则,公共部门可能利用自身存在的系列优势和利用纳税人的公共投入开发该增值产品,从而造成不公平竞争。

4.技术需求

4.1信息采集

主要涉及:

1)自产资源录入;(2)外购资源导入;(3)专业系统导入;(4)互联网络导入;(5)文件服务采集。

4.2信息的分类

刚才教授已经提出了一些非常重要的标准。

可以考虑信息的服务对象进行分类,分类要具有科学性、系统性、可扩展性、兼容性、实用性、均衡性等原则;可以考虑将信息进行主题分类、行业分类、服务分类和资源形态分类的分类方法,每类下面进行细分;可以考虑制定信息分类的专门标准和信息分类的符号标准方案。

4.3信息描述

可以考虑先制定信息描述的标准,元数据标准的制定是应该考虑的;核心元数据定义了描述电网情报资源所需的核心元数据的数据项集合、各数据项语义定义和著录规则等。它提供了有关知识产权资源的标识、内容、管理、维护的描述信息。

4.4信息控制

根据访问用户、SSL加密传输、防火墙、授权机制身份验证机制、数据等级保护用户行为跟踪操作日志记录等等来做成一系列的安全防控体系。

5.关键技术实现构想

5.1 系统平台构架

平台由数据源、数据存储、平台框架、平台服务等一系列构成,平台服务主要是对外服务的,包括一次二次跨库检索。

5.2  相关标准设计

主要重要的标准包括:知识产权数据库数字资源加工标准与操作指南;

知识产权数据库核心元数据标准;

知识产权数据库技术体系标准;为以后的兼容性比较重要

知识产权数据库信息资源标识符编码标准;

知识产权数据库信息资源分类标准;

5.3 基本功能流程

基本流程包括第一步骤的信息采集、定向采集、过滤转换、提出关键词、自动排重,然后自动摘要、自动分类、自动聚类、智能分析,包括更为长远的科学预警等

5.4 基本功能结构

基本的功能结构:信息采集、信息加工、信息服务、平台支撑

5.5 界面功能参考

有咨询记录,自己也可以发表作品,还有检索历史。做一些咨询,国际上的重大信息,企业和个人定制的资源。外部资源也是可以查询的,数据库不是封闭的,可以和外部套接。内部资源包括法律法规、案例、文书、数据库、等等。

我的发言完毕,谢谢大家

主持人:

我们第三位专家吴志强,武汉大学信息管理学院副教授,他演讲的题目是《法律资源数据库建设实践--以澳门法律双语增值检索系统为例》,大家欢迎。

吴志强副教授:

大家上午好,我受到老师邀请来参加这个会议,我现在更多的是做信息资源管理情报工作,看到这个课题后我抱着学习的态度来做个汇报,那我就就这个具体的应用来给大家做个汇报,我主要谈一下我的体会,主要是澳门的经验,获取澳门的经验可以为我们这个课题提供一点借鉴。

项目背景:

受澳门澳门文献信息学会的委托,作为澳门图书馆的一项数字化资源建设项目,同时也是作为澳门回归十年的献礼,由武汉大学信息资源管理学院、武汉大学信息资源研究中心、武汉大学知识产权高级研究中心联合研发。

我主要讲以下几个部分,澳门法律特点,系统研制情况,系统特色,技术创新,几点体会。

一、澳门法律特点与存在的现实问题

澳门法律概况:

澳门现行的社会制度总体上是以葡萄牙的社会制度为模式的。政治、经济和法律制度均如此。所以,澳门的法律制度也具有明显的葡萄牙法特征,它反映在法律渊源、法律结构、司法体系,以及法律操作等方面。

澳门法律由葡萄牙法律、葡萄牙为澳门制定的法律、澳门本身立法机构制定的法律三大部分构成。葡萄牙法律在澳门的延伸适用,是在1749年后逐渐进行的。1822年葡萄牙第一部宪法中,正式把澳门视为葡萄牙在海外的殖民地之一,并将葡萄牙的法律当然地视作澳门的法律。此后,葡萄牙的一些主要法典陆续被延伸到澳门适用。

澳门自1976年具有立法权后,其法律体系也发生了变化,包括葡萄牙为澳门制定的法律,如《澳门组织章程》、《澳门司法组织纲要法》等,以及澳门地区本身管理机关制定的法律,如出版法,教育制度法令等。这些法律都用葡萄牙语写成,只有立法会制定的重要法律有中文译本。近年来,随着澳门司法体系自治化进程的加快,新颁布的法律、法令才有中译本。

澳门法律存在的问题:

法律的汇编问题,澳门相关部门没有对法律法规进行过系统的汇编工作,只是按照颁布机关来对法律法规进行分类,从而导致了人们不能对澳门法律有一个全面而系统的了解

法律的整理问题:澳门在回归以前制定的法律,有很多是效力不明确的。在澳门回归祖国后,因为基本法在澳门的施行,有些法律是否继续生效还不明确,大量法律需要根据基本法的规定来进行整理

法律的本地化问题,澳门的很多法律是葡萄牙延伸到澳门适用的,有很多方面已经不适应澳门本地的实际情况。

澳门有三大法律网包括澳门法律资料查询系统、澳门特区公报网(印务局相当与我们的知识产权局)还有澳门法律网,这三个网络存在很大的问题。

澳门三大法律网存在的问题(1):

澳门法律资料查询系统(LegisMac)(行政公职局),这个系统是特点推出时间比较早(1972年),收录法律数量及种类比较全面,共收录了从1855年到2010年共61567笔记录档。系统在检索可视化方面比较专业,检索效率比较高。在法律信息可视化方面,legisac提供了种类及编号、公布日期、刊登于、文本、状态、叙述词、摘要、页数、注记等注释显示,系统所突出的问题是缺乏法律内容的展示,这导致了用户必须点击印务局的链接才可以看到法律法规的内容。

澳门三大法律网存在的问题(2):

澳门特区公报网(印务局),澳门法律以公报的形式由印务局进行公布,公报网只有简单的查询页面,而且法律内容显示形式简单,只以整体的形式将法律公布出来,系统只有浏览功能,而不能给用户提供更多的法律增值报务。公报网突出的问题是人们在网面上已经不能看到当年法律法规的原文内容,而只能看经过修改决定修改过的法律内容,这对于专业人士应用及研究法律来讲是极为不便的。

澳门三大法律网存在的问题(3):

澳门法律网,澳门法律网是将上澳门法律资料查询系统和印务局的数据进行了部分整合,同时增加了判决的检索。放弃了叙述词检索及显示,增加了全文检索功能,法律网存在的主要问题是回归前和回归后的检索是分开的,没有延续性。

总的来说澳门法律网存在以下情况:法律体系复杂混乱,没有部门对法律进行过系统化的汇编工作。大量回归前的法律的效力状态不明确,急需根据基本法的规定对法律进行清理。

法律信息显示形式单一,法律信息显示只能简单的显示中文版面或葡文版面。法律信息没有进行充分利用,不能给用户带来增值服务。检索方式单一,现在澳门三大法律查询系统没有给用户提供深度检索功能,用户难以对法律信息进行精确的检索。律信息分散,没有对法律信息进行很好的汇聚。

下面我们来具体看一下系统研制情况。

 二、系统研制情况

1、资源的搜录

系统收录从1976-2010年澳门所有类别法律法规12000条,判决约2600条。在法律数据更新方面系统采取了每天与澳门相关检索系统和印务局同步更新的方式。系统数据源来源于legisMac、印务局和澳门最高法院。基础数据主要从以上三个机构获得,其中主要是从印务局,没有的才从最高法院获得,因为获得了澳门公务机构的支持,所以现在进展还可以,

2. 资源组织

1)数据组织

系统在法律法规方面的数据整合了legisac印务局的所有注释字段及法律法规内容。

在判决方面系统采用的澳门最高法律的判决数据。在法律法规数据的内容上采用的是印务局的法律内容,同时对内容进行的再处理。

具体方法的方法是对法律法规内容的编章节结构进行提取,一直提取到条文内容,这是整个数据组织中最为核心的部分,同时也是整个系统工作的前提。具体细到法律的每一个条而不是文本本身。另几个内容是分类组织主题组织全文标引,我在听了教授的报告后发现在标引方面我学习的还不够,我们在澳门数据库的时候采取的是部门分离体系。采用主题词进行挖掘。

(2)分类组织

 系统在法律法规的分类:以部门分类为标准,同时结合澳门特点进行分类,也保留了按施政纲领进行分类。

3)主题组织

 借助legisac叙词并对叙词进行挖掘,建立了主题词与相关法律之间的智能对应功能。  

4)全文标引

对法律条文进行智能分词、深度标引,构建分类-主题词-关键词体系,并实现语义关联。

3.增值检索功能

深度检索:本系统给用户提供二次检索的功能,提高了用户检索的精确性。

条文检索,在检索到具体的法律后可以再进行条文内容的检索,具体是输入关键词在法律法规的内容中进行检索,系统会把输出关键字所在的法律条文的列表。

条号检索:用户在检索到具体的法律后可以进行条文编号的检索,具体是输入条文的号码,系统输出检索到的法律的条文内容。

还有一个法律沿革检索,通过沿革检索可以知道整个立法的进程,动态,修改前是什么,修改后是什么,每次修改的内容是什么,澳门现有的法律查询系统当中,用户是无法看到经历次修改决定修改后的法规文本,更无法看到最初的原文,只能在旧法的页面上看到最新的版本,这对于法律专业人士是和学习研究法学的人士是极为不利的,本系统引入的法律沿革这一功能,具体做法就是:法律法规异动的回溯列表和异动法律条文的原文显示,只要点击异动就会弹出来法律条文的原文是什么,这极大地方便了立法机关和法学研究人员对某一法律的沿革情况,进而便于法律的修改和研究。

还有一个比较重要的是法律条文与判决、立法会决议以及法律著作之间的智能交互链接功能。这个比较好,如果在查询相关资源的时候,会出现一个热点,当我点击热点的时候会出现相关的信息,这就是交互链接,包括法律文书与判决、立法会议决议,以及法律著作之间的交互链接,通过一个可以找到相关的信息。

以上是对系统的介绍我从中总结出了几个特点,也就是大三部分:系统特色。

三、系统特色

1.双语对照

系统在法律信息可视化方面做到了全部法律信息的双语对照显示,对照显示方式采用了鼠标放在文字弹出对照语种和在页面上同时显示双语的形式。

 2、根据输入语种来输出检索结果

系统可根据输入检索关键字的语言来决定检索结果的语言,如输入中文关键字输出中文结果,且当鼠标放在结果列表中的文字上,可翻译成葡文,反之亦然。该功能极大的方便了专业人士及学习研究法学之人士。

同时 系统在检索方面保留澳门的检索习惯,使用用户能够通过葡语来对法律进行检索

3、笔记检索

系统还具有笔记检索的功能,系统为用户提供了笔记检索功能,可以让用户对法律条文及判决作个人记录、评论等。

 四、技术创新

 该系统是一个开源平台,数据库架构在Java平台之上,Web服务使用Tomcat服务器、数据库使用MySQL数据库服务器,具有低廉的运维成本和良好的维护性和安全性。

关于检索框架,流行的检索框架和数据库构架:本系统分为“索引与检索”、“数据录入、管理与显示”两大部分。“索引与检索” 使用了目前最为流行的开源Java检索框架Lucene实现, “数据录入、管理与显示”使用了Struts2网络应用开发框架与数据库持久层框架Hibernate

 在索引的技术创新上主要表现为一下几点:智能分词:系统采用自行开发的适用澳门法律的部件词典,对法律文本进行深度标引。索引词库:系统采用自行开发的适用于法律检索的繁体中文词库,该词库能大幅提高查询结果的准确率,并且词库有高度的扩展性。数据录入与索引绑定:在录入数据库的同时,法律数据经过规整和分词加入索引库。在修改数据的同时,索引信息被自动修改。具有较高的可维护性。

其次在检索上的技术创新主要体现在:语义的全文检索:能实现法律信息与法律条文的全文检索而非简单关键字匹配,在分类-主题词-关键词体系框架下对检索结果进行相关性排序。跨语言检索:系统在中葡词典基础上,开发了适用于法律的中文-葡萄牙文双语语料库,

现在已经建立了庞大的语言库,没有语言库这些是做不出来的。在检索过程中根据输入语种来输出检索结果。智能交互链接:在法律条文与判决、立法会决议以及法律著作之间实现了智能交互链接功能。

系统是有的安全技术:系统采用Spring-Security框架实现严格的基于角色的安全访问控制设计,系统用户分为三种:系统管理用户、业务管理用户和普通用户,每种用户都有其指定的角色,整个访问控制过程就是访问权限与角色相关联,角色再与用户关联,从而实现用户与访问权限的逻辑分离,具有强大的安全权限控制扩展能力。 

五、法律数据库建设的几点体会

在建设法律数据库我有几点体会,我就做个简单的说明:

第一个,我们建设数据库的定位是什么。我们这个建设是定位在一个数据库呢,还是定位在一个检索系统,还是定位在一个服务平台,这个实际影响系统的功能和我们后续的研发。

第二个是用户需求的问题,我们的这个系统,首先就要弄清楚用户使用我们信息的目的是什么,这个非常重要,直接影响到我们设计一个系统或服务平台的功能需求。

第三个是资源的特色问题和覆盖度问题,刚才老师也说了,知识产权资源和法律的资源可能是交叉的,知识产权资源包含在法律资源量,那知识产权资源的特色在哪里,除了法律法规、文献论文、判例还有什么,因为我们建立这个系统必须和现有的库相区别,包括北大法宝等,所以需要好好把握覆盖度的问题,我认为知识产权数据库是一个专题数据库,所以它的内容一定要全。

第四个是用户体验的问题,要仔细的考虑用户愿不愿意用的问题,用户能不能从系统中体验到其特别需要的东西,用户的满意度怎么样。

最后一个是技术的成熟性与先进新性问题。个人认为技术还是使用成熟的而不是先进的,比如检索系统,可以和其他系统合作一下看一下他们的检索怎么样。

这就是我的一点想法,谢谢大家。

主持人:

我们做一下点评,首先由欧阳晨红,中国政法大学图书馆副馆长、研究馆员。

欧阳晨红

我觉得他们三个人说的很好,就是我们这个项目的骨架,不管是标引还是信息增值,还是系统服务就是目前我们要做的一个框架,没有前期的标引等这个数据库就很难建成。还有刚才说的平台的九个功能问题也很重要,需要我们好好研究一下。

主持人:

下面由第二个点评人胡梦云,湘潭大学法学院副教授,来点评一下。

胡梦云:

感谢大家,因为我一直是在学法律,我就从法律方面说说我的看法,数据库的保护在我国一直以汇编作品来保护,汇编作品有一个编排独创性问题,听了老师标引的过程后,我就在想编排的独创性能不能和标引联系一下,还有一个数据库立足点问题,数据库公共性和盈利性之间的问题,这会影响到数据库的使用,比如我在使用裁判文书网时,为什么只能看不能复制,这个问题还需要进一步考虑,这是我自己的问题,希望我们大家一起思考。


第二场 国家知识产权文献及信息资料库

模板设计与技术实现

主持人:

刘瑛,中国政法大学民商经济法学院副教授

主讲人:

仇壮丽,湘潭大学公共管理学院副教授(国家知识产权文献及信息资料库建设方案与设计思路)

蒋东兴,清华大学计算机与信息中心主任(数据库建设的最新技术与运用现状)

邓毅沣,长沙科云信息技术有限公司总经理、中南林业科技大学教师、中国政法大学知识产权法专业在职博士生(科云网的建设经验与国家知识产权文献及信息资料库建设的启示)

评议人:

王宝珠,中国政法大学科技教学部副教授

赵秀姣,北京交通大学图书馆信息咨询部馆员

内容纪要:

主持人:

各位老师、专家,下午好!我们现在开始第二场研讨会,题目是:国家知识产权文献及信息资料库模板设计与技术实现。这一场研讨会重要的特点是从技术层面研究我们的课题。从课题的安排可以看出主持人的精心设计。这一场研讨会的发言人有三位,首先我们欢迎第一位发言人:仇壮丽,他是湘潭大学公共管理学院副教授。演讲题目为:国家知识产权文献及信息资料库建设方案与设计思路。

仇壮丽副教授:

各位专家下午好!

目前国家知识产权文献及信息资料库的建设还不太成熟,所以我就谈一下自己的看法。在第一次研讨会时,我们对于要建设什么样的数据库系统就有一定的争论。初步建成的数据库模型在功能上是完备的,在数据上还不太齐全。重大项目的完成应是一个过程,我们的最终目标是要建成一个全面检索、准确检索、快速检索的数据库系统。数据库系统应该是不断成长的,不可能一步到位。要开发一个数据库系统首先要进行用户需求分析,用户要什么,我们就要有什么样的功能。目前国内很多数据库在提供服务时都没有从用户的角度进行考虑,而是数据库有什么样的字段,就提供什么样的检索入口,事实上用户有时不会用这些检索入口。

要开发新的数据库系统,要让我们的数据库系统和现有的数据库系统不一样,我们就要先分析现有数据库的发展情况。目前国内有很多知识产权数据库,从总体上来看,国内专题数据库与国外相比,起步比较晚,但是发展较快。据统计大致有700多个专题数据库,而且地方知识产权局也开发了300多个专题数据库,社会信息服务机构大概建成200多个专题数据库,此外还有行业和信息服务机构有30多个数据库,大学和企业也建立了专题数据库。同时数据库的建设主体呈现出多元化的趋势。如图所示,建设主体以知识产权局系统为主,因为它有制定优势。建成专利数据库系统的知识产权局有27家,行业信息服务机构有18家,科技信息服务机构和社会信息服务机构各有7家。此外,企业的专利意识开始加强,从目前的专题数据库来看,80%以上都是为企业服务。那么,目前专利数据库存在的问题表现为:1、数据收录不全,信息不完整。2、检索方法单一。3、专题数据库缺乏深度加工和标引,信息挖掘程度比较低。对信息进行深加工的数据库有中国药物专利数据库系统。此数据库对摘要进行了重新编写,对于检索药方很有帮助。4、知识产权管理机构和信息服务机构之间缺乏合作机制,不能实现优势互补。与知识产权信息的相关机构有很多,有的机构具有资源优势,有的机构信息加工能力比较强,但是各机构建立自己的数据库,缺乏合作。

新的数据库系统要实现的功能表现为以下三个方面:1、数据的导入/录入功能。2、数据的检索/输出功能。3、系统的维护功能。我们目前所做的工作大致是对知识产权文献信息进行加工形成知识产权文献数据库,而怎样建设搜索引擎则是后续的工作。我们要建成的数据库大致包括以下内容:知识产权研究资料库、知识产权网络资源库、知识产权法律法规文献库、知识产权确权与登记资料库、知识产权司法与执法资料库、知识产权机构与任务和知识产权大事记。这些都是我们的大数据库之下的小数据库。从数据库的功能来看,我们不仅要建立源数据库,还应提供一些深层次的服务。我们可以借鉴一下欧洲专利局的专利资源信息资料库。此外我们一定要有质量保证机制。源数据质量影响后期的检索性能。而质量标准也有很多,我把标准分了一下类,首先是内在质量标准,有些信息是不能被我们所控制的,这些信息就需符合内在质量标准。此外还有一些信息是能够被我们所控制的,这些信息就要符合外在质量标准、访问标准和背景信息标准。外在质量标准就是要保证数据库的一致性。访问标准指的是要开发比较好的检索系统、搜索引擎。背景信息标准指的是在检索时要选择合适的数据库,选择合适的检索策略。在数据库的建设过程中,要控制外在质量、访问质量和背景质量。最后,我们要把收集到的数据放到数据库中去,这一过程的难度不是很大。

对于系统的开发方式共有四种,第一是自主开发。第二是合作开发。第三是外包。最后是众包,目前很多网站采用众包的方式,比如百度文库。我认为,像我们的案例数据库和法律法规数据库可以采用众包的方式。至于采用何种平台,我认为这一问题不是很大,目前有很多成熟的软件可以支持。对于开发步骤的选择,也就是我们是不是能够一次性的把功能全部实现。一次实现所有功能比较难,所以我们可以考虑阶段性地实现。首先我们可以先实现全的功能,然后在经过深度标引和深度加工实现准的功能,最后我们在慢慢调试性能,达到性能最优,实现快的功能。检索方式我们也可以分步走,先实现关键词检索,这一检索方式最方便、最快。然后在开发全文数据库,建立全文索引,实现全文检索。最后是建立关联词库,实现语意检索。我认为分步走的策略比较适合我们的项目。国外的数据库也大多是分步实现所有的功能。

我的演讲内容就是这些,谢谢大家!

主持人:

谢仇教授的精彩演讲!下面我们欢迎清华大学计算机与信息中心主任蒋东兴来为大家发言。蒋主任的演讲题目是:数据库建设的最新技术与运用现状。

蒋东兴主任:

各位老师、同学,大家好!非常高兴能和大家交流。昨天晚上经过和冯老师的交流,把题目改为知识组织与分享系统的设计思路。我大致从四个方面介绍:1、信息技术对知识管理的革命性影响。2、知识组织与分享系统的功能与结构。3、知识组织与分享系统的关键技术介绍。4、知识组织与分享系统建设与运营模式。

首先来说一下信息技术对知识管理的革命性影响。从知识的发展历程来说,造纸术和印刷术的影响非常重大,造纸术让我们的知识有了良好的载体,而印刷术扩大了信息交流传递的容量和范围,让人类知识的广泛传播成为可能。而信息技术又让造纸术和印刷术发生了根本性的变化,信息技术使得人类知识的传播突破了时空和容量限制,也突破了语言文字种类的限制,现在,通过信息技术,已经打破了知识传播过程中不可逾越的鸿沟。还有很重要的一点是信息技术改变了知识的获取与利用方式,随着云计算、移动互联等技术的快速发展与普及应用,我们可以随时随地上网查找所需要的信息,也就是说知识就在手头成为了现实,知识已经不必都记忆在人类的大脑中,只要把知识纳入到自己的知识管理体系之中,即使没有记忆下来,自己也可以随时查找到所需的知识,也就意味着人类获取的知识已经脱离了大脑的内层,而转化到外层中去,这种转变是非常大的。信息技术也改变了个人知识的自组织模式。随着知识载体从以往的单一书本形式转化为多媒体知识包,知识的组织形式从以往的线性排列转向超文本结构,个人知识的存储也由单一的内存(大脑)扩展到外存(在线知识库)。互联网机制也充分发挥了人类的联想机制,对人类的思维方式产生了关键性的影响。原来知识的获取只能靠师生的传授,因此原先教师的教学方式都是灌输式,而现在则不同,教师只把知识体系传授给学生,学生则自己挖掘知识。以前老师是掌握知识的优势主体,而现在,老师不知道的知识,学生上网就可以查到。

由于信息技术带来如此多的变化,因此,应如何发挥信息技术的革命性影响?首先应建立个人知识管理(PKM)环境,个人知识管理是一种新的知识管理的理念和方法,也就是能将个人拥有的各种资料、随手可得的信息变成更具价值的知识,最终利于自己的工作、生活。个人知识管理环境首先要提供完善的“知识分类体系”功能。其次还要提供海量的存储与快速的检索功能,只有提供海量的存储和快速的检索,才能实现知识在手头。第三,个人知识管理环境还要提供安全的自动备份与便捷的封装打包功能,以帮助个人安全保存知识内容并能方便携带。此外,还要提供完备的知识分享环境,实际上是构建一个知识系统,让数据库在众人拾柴火焰高的作用下,成为一个活跃度更高的“数字图书馆”。但是,许多人提供的信息虽然保证了信息的数量,但同时,也会使得信息无序,因此,如何解决这一问题是关键。另外,还要提供交流与协作的环境,知识和知识人的关系,知识群体和知识体系的关系,如何交流与协作也是我们需要考虑的问题。

下面我想来阐述一下几个关键性的概念。一个是社交网络。社交网络是一种允许个人在有边界的系统中构建公开或者半公开的个人空间,阐明与自己有联系用户的列表,以及查看和遍历这一用户列表和列表中用户发布的信息的网络服务。社交网络的三要素是个人、关系和交互模式。社交网络的特点有以下几点:1、强调用户的真实身份和建立与用户之间真实社交关系相对应的网络联系。2、强调用户创造的内容,并突出这些内容通过与真实社交关系相对应的网络联系的传播,以降低用户获取信息的成本,提高信息传播的有效性。还有一个是知识共享模型。知识共享模型包括知识共享对象、知识共享主体和知识共享手段。因此,我觉得我们的系统应既是知识中心,又是社交中心,也是活动中心。人、事件、场所是我们需要重点考虑的三个要素。在知识产权问题的研究与解决上就是构建人群网络、传播网络和知识网络。

下面来说一下关键的技术。第一是支持个人、团体、机构协同的知识管理。我们现在所用的管理系统大多是对文档的管理,而知识的管理更重要的是知识组织形式的管理,知识管理系统建成以后实际上是解决了个人的知识管理问题,而对于团队知识管理来说,就涉及到分享,也就是知识怎么能在知识人之间进行分享。第二是我们现在正在做的结构化标签模型,实际上是想通过维度、维度值和维度序列来构建个人知识管理和团队知识管理的桥梁,每一个维度值可以看做一个标签,把同一个范畴内的标签集合来形成一个维度,维度应是尽量不交叉,我们构建维度和维度值也是为了定位,每个人可以构建个性化的维度和维度序列,但是我们同时可以设置默认的维度,也就是大家公认的维度,这也就是希望通过结构化标签的方法来实现了个人知识管理和团队知识管理的衔接。第三个是基于电子校务平台数据的关系挖掘,目前通过公共的社交网络建立起来的关系是很弱的,但是,在一个范围之内,如在学校,建立起来的关系是很强的。校园社交网络中的社交关系有很大部分来源于电子校务平台,校园社交网络中的关系管理着重通过从电子校务平台中积累的数据中挖掘校园中存在的各种人际关系来增强好友推荐组件的功能,校园社交网络中的群组关系组件根据校园社交网络中的群组关系大都对应现实中群体的特点增加了将群组成员批量加为好友的功能;并通过群组关系挖掘从电子校务平台积累的数据中获得了大量的群组信息,包括与正式群体对应的群组和非正式群体对应的群组。第四是支持社交和协作的关系模型设计,这也是目前的研究热点问题,人人网和新浪微博都有不同的关系模式。在社交方面,校园社交网络中的用户不仅会与已经认识的人联系,而且更愿意结识新的朋友和乐于分享各种信息。因此,校园社交网络中的个人关系模型更适宜采用单向确认的跟随关系或者圈子关系,并增加对用户之间共同点的分析,以帮助用户更好的扩展个人的社交网络。在协作方面,校园社交网络中的群组关系不仅应支持用户自定义群组和申请加入群组,而且还要根据用户属性的分析并预先建立一些群组并加入相关的用户。 个人关系模型可以分为单向确认的关系和双向确认的关系。第五是面向移动互联与智能终端的云服务。随着无线互联和智能终端的发展,我们随时随地体验不同的信息服务,我认为云服务的模式是必然的选择。第六就是与数字校园衔接的权限控制和隐私保护,我们应当尽可能提供细粒度的访问权限控制;为不同类别的用户提供合适的访问权限控制方案; 并以图形、表格等易于理解的方式向用户提供有关信息传播方面的提示和统计; 在引入第三方应用时,要对应用在隐私保护和信息安全保护方面要通过加密等措施来进行防范。运营模式可以有独立运营、联合运营、企业主导三种方式,阿里巴巴的成功运营为我们提供了很好的参考作用。

谢谢大家!

主持人:

蒋主任为我们带来了更专业的信息,这不仅对我们的课题起到了很好的指引作用,同时对我们日常的知识管理也很有启发。感谢蒋主任的分享!第三位演讲人是邓毅沣博士,他是长沙科云信息技术有限公司总经理、中南林业科技大学教师、中国政法大学知识产权法专业在职博士。他演讲的题目是“科云网的建设经验与国家知识产权文献及信息资料库建设的启示”。欢迎博士!

邓毅沣博士:

非常感谢蒋老师刚才关于云计算、云共享、云存储、云备份的阐述,也非常感谢上午的几位老师。我发现各位老师的演讲中有一些不谋而合的地方。对于我所演讲的题目,我主要查找了以下网站:TIThomson Innovation ),其优势在于专利家族和独特分类;Innography ,其强项为强度分析和相似分析;美国专利CLAIMS系列数据库(CLAIMS)STN;国家知识产权局专利检索与服务系统;Soopat专利搜索引擎等。对于这几个系统,我感觉前面的几个美国系统是检索的行家,而我国的这几个系统仅处于检索的初级阶段。通过对这些网站的研究,我感觉要将科云网与数据库研究相结合的话,需要有以下共同点:1.必须要有一个基础数据库;2.搜索绝对是核心;3.数据库必须要有服务。那我先把我的建议给大家拿出来分享一下:1、以云共享为基础,搜索为核心,构建一个数据全,搜索高效,服务专业,互动性强的知识产权信息数据库平台。其中的互动性是由云引申过来的,与老师讲的社交系统或交互系统是相似的。2、实现资源共享、资讯检索、学习教育、实务营运四大功能。而不只是检索功能。其中云分享是前提。3、有步骤的实现专业、高效的搜索功能。4、走学术教育公益化+专业服务商业化并行的营运之路。这是数据库建设中的一条出路。

为什么我回提出这样的建议,下面我结合我的科云网给大家一个初步的讲解。希望通过对科云的介绍给我们数据库的建设一点经验和探讨。科云是以数据库为核心的,其目的是实现法律的平民化,实现每一个人通过我们的搜索引擎找到需要的东西,实现云搜索的最低阶段综合搜索引擎上升到专家系统阶段、最后达到人工智能阶段。所以,科云的法律构架是这样的:以云分享为基础;以垂直站内、站外搜索为核心;集聚资讯检索、学习教育、资源共享、实务营运四大功能为一体的法律信息服务平台。其实科云与国家知识产权信息资料库的建设有一个共同的基础,就是数据、搜索和服务这三项。

对于数据库平台的构建,我认为有以下方面需要考虑:一是数据库信息资料基础(专业数据库)。目前,科云网的知识产权数据库包括以下方面:知识产权信息;9万个知识产权判决;3943个知识产权法律规范;立法背景;审判指导;知识产权百科;知识产权文书;知识产权流程和重大事件。这些都可以构成我们知识产权信息数据库的基础。现在科云包括相当多的数据,这主要体现了云分享的功能。二是受众定位。我认为基础数据库和搜索的特殊性,定位不应单一。今后的趋势应该是专业性与普遍性相结合的趋势。三是功能。主要分为四部分:资讯检索、学习教育、资源共享、实务运营。其中,搜索分为综合搜索和高级搜索。对于学习教育平台,数据库的系统性和程序性就是最好的学习教育资料;法律流程的规范化是学习教育的课本;互动型的交流模式是实践平台。四是数据库构架及技术解决(如何实现)。我们与前面几位老师讲的技术构建模式是不谋而合的。我们的技术解决方案是这样的:采用NET语言,ORACLE数据库,LUCENE搜索引擎,ORACLE:分表列库+并发式处理,LUCENE:全文搜索+模糊匹配,研发中的技术:FLASH页面展示;视屏文档交互系统。五是盈利模式(如何生存和发展)。在我看来,数据库无盈利就无生存、无发展。我们的盈利原则是一般用户免费,商户和专业需求客户收费。我们的盈利主要有广告盈利,包括百度联盟;谷歌联盟;代发广告、信息;竞价排名;第三方插件分成等。还有增值盈利,包括专家搜索收费、信息内容收费、法律服务交易;法律服务中介;接收委托代理等。法律服务其实包括三个方面:风险防御、决策参与、纠纷解决。可见,我们的盈利模式是相当广泛的。

我的演讲就到这里,谢谢大家!

主持人:

非常感谢邓博士富有激情的演讲!下面有请点评嘉宾予以点评。

王宝珠:

这几位发言人的演讲对我启发较大。从事计算机基础和数据库教学的我,感受到我校在教学方面从内容到手段现在还需要大力提升。以后,希望我校能够结合本校特点引进法律数据库,使得教育紧跟形势的需要。

赵秀姣:

我从微观角度也就是用户需求方面来谈一下我的感想。现在云计算遍地开花,应用广泛。已形成“不是知识在哪我跟到,而是我走到哪知识跟到哪”的这样一种趋势。社交网络的影响是将来信息产业的发展方向,因此建议与社交网络进行合作。从检索人员角度来讲,关于标引的问题,建议老师加深讲述。还有就是要有好的用户界面,因为普通使用者对资料的调用能力较低。同时,分类标引的方向要确定好。

主持人:

谢谢两位点评人的美好展望与具体建议!


第三场:国家知识产权文献及信息资料库建设现状调查与展望

主持人:杨利华,中国政法大学知识产权法研究所副教授

主讲人:郑璇玉,中国政法大学知识产权法研究所副教授(国家知识产权文献及信息资料库建设调研分析)

评议人:

冯晓青,中国政法大学知识产权法研究所教授

内容纪要:

主持人:

下面我们开始进行第三场,就我们前面这段时间的调查情况进行讨论。开题时,了解用户的需求,定位是一项非常重要的工作。了解用户需求是非常重要的工作。在调研过程中,分这样几个阶段:一起进行了问卷设计。内容、受众广泛。设计了四套问卷。第一套:学生版调查问卷。潜在的用户。专业版和实务版是现在的用户。第二套是专业版,定位是对知识产权的专业人士,包括国家知识产权局的协助,对他们不同的机构、他们的工作人员进行知识产权、知识产权信息、知识产权信息库的建设这些主要问题进行系统的回答。除了国家知识产权局,我们对一些有知识产权管辖权的法院、教学机构、知识产权公司、事务所,还有以知识产权为主业的律师,以及从事知识产权信息服务的这样一些机构,乃至企业知识产权法务这样一些专业人员展开了一些调研。第三套是实务版,实务版针对公众中可能直接或间接接触到知识产权的专业人士,包括企业的生产、研究、技术研发人员,还有行政管理人员,以及高校中的非知识产权专业的老师。还有一个是公众版:开始想请同学们做街头调研,最后换为在网络上面做调研,发到网上征集了一个月的时间,我们这样通过网络进行调研。这四个版本的问卷,调查还是我们各位极大的帮助。印象比较深的是深圳知识产权研究会的工作人员除了认真回答我们的问题以外,还提交了1400多字的建议。还有我们老师也在做完后给了初步的统计分析材料。还有其他像北师大老师等等的专业人士给了我们很多有价值的资料。问卷的代表性比较强,我初步统计了一下,我们涉及到的省市,像北京,北京各个机构数量比较多,我们的同学跑了北京的很多学校。上海我们委托了一位老师,调查了20多个班级,不同的专业。这样,我们是为了有代表性地了解用户对知识产权的认知现状和需求。像实务版,博士组织完成了几百份的调查问卷,广泛地对各个机关进行了调查。有一个江西版,我们委托的是教授的一个学生做的,他基本上把江西每一个政府的调查都完成了。这样就构成了今天由老师分析的,包括四个版本的共有7000多份的问卷的调查数据。我们的目的是想了解与知识产权相关的受众、我们自己这些科研人员以及企业的实务工作人员,以及实实在在为知识产权工作的人员关于对知识产权、知识产权信息、知识产权信息服务这些现状,希望这种研究对以下的数据库建设活动有所参考意义。具体的研究内容我们就委托老师和北大的一个教育专家进行了比较科学的科学分析和统计。下面请老师介绍一下这一部分的内容。

郑璇玉副教授:

感谢主持人的邀请,我之所以参加这个课题,因为我本来以为它与知识产权的关系不是那么紧密,后来又有一个想法让我参加了。我始终认为数据库是一个载体或者手段,而里面的内容是指,对里面内容对象的分析决定了它的有用性或者专业性,所以我认为我们之所以把这个题目定为“国家知识产权文献和信息资源建设现状和分析”,而且能够成功地获得批准,实际上是以知识产权对象为研究目的的一个有用性的基础研究,这样我是把这个有用性的价值作为一个定性和定量,对这次的分析是基于这样一个目的,而且是希望在实证主义的分析之上,对这个有用性的目的进行一个论证。作为一个数据统计工作,我最大的要求是不能带着有色眼镜进行研究,我不能把之前的目的灌输进去,从而体现在问卷的设计以及问卷的结果上。因为从科学的角度来讲,任何数据的得出都必须客观的、唯一的、统一的,不管我是带着什么样的目的,它所反映出的结果,哪怕是这个数据库的建设是大家都不需要的,我也必须如实向大家反映。很开心的是,我这个论证结果正好是上午肖老师的一些问题和下午老师的在报告中得到的一些结果,在数据当中得到一致的意见。我来和大家分享一下。

论证分成两个部分:一个是内容有用性的论证,比如说怎样去筛选信息,怎样去除垃圾信息,第二是对数据有用性的未来的分析,即它对企业管理、对国家制度建设上的有用性的推动,这是两个有用性的论证。通常对知识产权,我们有这样一个说法,信息产权,建立在这种提法的基础之上,其实信息可以作为一种产权的基础,但是并不是所有的信息都可以作为信息产权的对象,所以第一步要确定哪些信息可以作为信息产权的对象。第二个论证的是使信息上升为权利乃至成为信息产权制度化的可能性的问题。

对数据的分析步骤和方法上有三种:第一是基本分析,第二是交叉分析,第三是高级分析。所谓基本分析,是对调查现状的基本问题的描述。交叉分析是我主要给大家展示的一种分析。有两种方法,一种是基于答案的分析,它是以总答案作为分母,分析每个答案的价值;第二种分析是分析到个体或者家庭这种单位,分析每一个个体的价值在总的个体作为分母之上的这样一种分析方法。我主要采取了这种分析方法,出来的成果叫做交叉表。第三种高级分析,这是一个复杂结构的演变,目前只能做到对数据的处理和初级数据的控制上。

我们的样本是从2010年抽取,抽取主要来自几个主要的城市,如北京、上海、广州等一线城市和二线城市和三线城市,根据年龄的不同,来自于高校的实务工作者和专业人士进行了不同的演算。不同类别的人士是指比如认为主管部门对信息开放程度不够的、政法扶持力度不够的、信息服务业缺乏权威的这样一些人,是这样的一个人群的构架。通过七千多份问卷的检索,我们得出这样的信息,目前知识产权获取的现状特点有三个:一、信息需求大;二、有一个潜在的受众的需求,对免费的网站更青睐;三、不管专业版人士还是普通受众人士都存在惰性,信息渠道不愿意拓展。下面我就这三点进行分析:

一、信息的网络需求很大。百分之八十五点多的实务工作者和百分之七十二点多的高校学生遇到过知识产权相关问题,而非实务工作者为百分之二十六点三,所以需求是很普遍的。但是从数据中我们可以得出,并非高校学生是需求知识产权的潜在主体,而实际上是实务工作者,因为他们已经确定职业的方向。

二、在免费网站的青睐程度上,我们发现:可以把网站分为收费网站和免费网站,还有科研机构网站和政府性网站。数据调查的结果中,有一个结果很有意思,高校学生和实务工作者中使用收费网站的人很少。学生中只有百分之十七点七,而实务工作者只有百分之二十三,即使是非常强调知识产权专业的专业人士也没有超过半数,只有百分之四十。可见免费网站的使用量是很大的。而且人们不是使用海量搜索,而是依赖于具体的一个或两个熟悉的网站,占百分之九十九。

我们分析受众的信息,现在存在的问题主要是:信息零散,缺乏系统整理。我们为了证明存在的问题设计了多种多样的问卷,主要问题可分为四大类:是否信息太散?是否缺乏管理导致不方便?是否信息公开不够?是不是公众的信息能力不强?我们发现,不管是哪一类的人群都认为缺乏系统的整理是当今的主要问题。这种达到百分之八十四点七。有人可能把结果归结为我们现在的信息数据库不好,或者是有用性不强。我们发现,人们认为现在的数据信息检索是否没有得到有效的整理的、没有及时更新的这样一个隐含的信息。去建设一个完美的、全面的数据库是大家需求的。建设一个中游的较为完备的及时更新的、主要是系统要经过整理的这样一个数据库是受众最受欢迎的。

建设这样一个中游的数据库的建设目标,受众对于建设目标提出三个属性:

一是全面,主要是针对实务人员的全面,而不是针对学生的全面。刚刚所说的免费网站的问题,学生是用高校免费的网站,可它并不是免费的,而是学校付费,这些数据得到有效的筛选和清理。全面性就要在数据库中实现检索方便的这样一个冲突,这个问题怎样解决呢?这里形成一个很有趣的受众的分析,在学习和研究领域对于版权的需求量是最强的,其次才是专利和商标;但是对于专业版中,他们认为对专利的需求最强,商标版权其次。在反应全面的基础之上,我们分为几大类,比如说研究论述、相关立法和制度、专利的权利信息或确权信息和侵权信息等、社会服务信息、其他信息。在这几类的分析中,我们通常认为研究论述和社会服务信息很重要,但数据结果的分析中,得到结论,最应满足的是专利的信息,其次才是相关立法制度的,最后才是研究论述和社会服务信息。二是智能性。三是部分免费性。我们通常认为数据库建设全部免费性是一个终极目标,但全部免费是不符合现代市场的需求,实际上只有高校学生认为不需要付费,而专业版的人士认为可以甚至应当付费。时间问题我就不多说了,这是初步的构想。以后与大家分享,我的发言就到这里了。

主持人:

刚刚老师跟我们一起分享了调研资料及其初步统计,下面请老师进行点评。

冯晓青教授:

老师对数据的初步整理,实际上还没有完全整理完,因为数据量确实很大。之后我们会有最终的成果和最终的调研报告。调研主要是由我和杨老师一手策划,但博士生和硕士生做提了一些意见,我们进行了多次修改。调查设计到很多机构和人员。调查方法上采用了全面调查和抽样调查。数据一共7000多份,通过郑老师初步的研究和介绍,我认为主要还是要立足于现实的状况,特别是我们课题的定位很重要。调研中大部分是客观题,小部分是主观题,这两方面结合起来,一定程度上我们可以反映国内不同的受众对知识产权文献和信息的利用以及对现有资料库的评价和看法。老师的分析很好,许多结论性的都对上午一些专家的发言印证,说明我们的资料和研究还是有某种科学性。调研基本告一段落,但会进行小范围的调研。调研费了我们很多时间和精力,各位都提供了无私的帮助。我对大家的帮助表示感谢。

主持人:

老师为我们调研给了很多帮助,下面我们请老师进行评价。

张冬教授:

我没有想到调研会跑到哈尔滨,我们对这方面非常重视,同学们虽然是理工科为主,但是热情很高,因为跟我们的专业很相关。我们也是代表性的发个各个专业的学生和工作人员。我很赞同郑璇玉老师的结论,我们也看到一种未来,就是大家都希望有一种权威性的信息库。其实信息库本身的价值是让人们感到更方便。随着科技的进步,我们的数据库要做最全的。


第四场  国家知识产权文献及信息资料库建设专项研究

主持人:刘友华,湘潭大学法学院副教授

主讲人:

张冬,哈尔滨工程大学知识产权法研究所所长、教授(国家传统知识之知识产权资料库建设的现状分析)

李喜蕊,中国政法大学知识产权法博士后(国内知识产权网络信息服务现状及启示)

付继存,中国政法大学知识产权法专业博士生(我国知识产权重大事件资料库建设的思路与对策)

何伦健,国家知识产权局专利复审委员会诉讼处(我国专利复审与无效信息资料服务现状分析)

评议人:

贺利云,农业部农业管理干部学院教师

内容纪要:

主持人:

现在开始我们的第四场我们的专题研讨。首先进行专题演讲的是张冬教授,她演讲的题目是“国家传统知识之知识产权资料库建设的现状分析”,大家欢迎!

张冬教授:

今天,我想从传统知识的角度谈知识产权的数据库建设现状,最终目的都是促进国家知识产权文献及信息资料库的建设。我研究这个问题的原因在于我曾经做过两年的传统医药的知产保护,看过许多反面的争议,所以非常希望促进我国传统知识的保护。

一、问题的提出

问题提出的反面原因在于传统知识国内的立法缺失、管理无秩,以及国际上对我国传统知识的不正当使用包括商业海盗和公知常规文献检索。问题提出的正面原因在于国家战略和国际机遇。国家战略包括十二五规划和十七届六中全会对传统文化保护的重视,国际机遇包括2010127日世界知识产权组织(WIPO)知识产权与遗传资源、传统知识及民间文学艺术表达的政府问委员会第17次会议对传统文化保护的强调。

二、基本概念

第二个部分我想明确一下基本概念的问题,即传统知识语境下是数据库还是资料库

其一,数据库与资料库的外延是存在差别的。资料库的外延比数据库小。数据库,即Datebase(数据库), 或者archives(档案文件),《中国大百科全书电子学与计算机》将数据库界定为:数据库是为满足某一部门中多个用户多种应用的需要,按照一定的数据模型在计算机系统中组织、存储和使用的互相联系的数据集合。数据库本质特征是高效率的整体性、共享性、检索结构化。因此,传统知识语境下更应该使用数据库,而不是资料库。

其二,更适合通过电子化的数据库的建设路径。由于传统知识需要特别保护形式,它表现为一定公开性、主体的群体性、一定地域内不特定以及人的无偿使用性。由于这些特点,使得它面临一些瓶颈,即被无偿使用而使用人或审查机构不知或难以知道该传统,因此就会造成知识所有人、使用人不特定和权利人无主的问题。

其三:国际知识产权通常使用广义数据库外延

法律界最早对数据库作的明确规定是在TRIPS协议中。TRIPS协议第10条第2款:“数据或其它材料的汇编,无论采用机器可读形式还是其它形式,只要其内容的选择或编排构成智力创作,即应予以保护。这类不延及数据或者材料本身的保护,不得损害数据或者材料本身已有的版权。”

欧洲议会和欧盟理事会于1996年颁布的《关于数据库法律保护的指令96/9/EC》第1条第2款规定:“在本指令中,‘数据库’是指经系统或有序的安排,并可通过电子或其它手段单独加以访问的作品、数据或其它材料的集合。

《世界知识产权组织版权条约》(WIPO Copyright Treaty, WCT”)第5条将数据库定义为:“数据或者其它材料的汇编,无论采用任何形式,只要由于内容的选择或者排列构成智力创作,其本身即受到保护。”可见,知识产权语境下的广义的数据库,除电子数据库外还包含非电子数据库,具体包括传统的百科全书、字典词典、电话号码簿、交通时刻表、法律法规汇编等。WIPO提出的有关数据库特点:

1)建立传统知识数据库前,需先取得传统知识利害关系人之同意;

2)应清楚明确地标示公开日期,以利于认定申请专利案是否丧失新颖性;

3)应注意对于传统知识公开媒介与方式,若是透过网际网路建立之数据库,应确保其内容不会消失,且维持不变;

4)对传统知识之公开需对其内容尽可能详尽;(5)应注意公开至何程度时始具有公共性。如仅是在传统部落(社群)中加以传授,并不能构成公共性,至少应向外界致人公开。

综上所述,我认为传统知识的知识产权保护建设更宜用数据库而非资料库。

传统知识数据库具有信息集合性、集合有序性、可访问性和检索方便四点显著特征。数据库具有高效率的整体性、共享性、检索结构化的显著特征。

三、建设现状:以传统优势产业医药类为代表

我国发展现状:

我国现有的医药类数据库主要是中国中药专利数据库及其检索系统 (CTCMPD),其中包括中药专利题录数据库、中药专利方剂数据库以及中药材词典数据库。但是我国的中国中药专利数据库及其检索系统由于时效性、完整性的缺陷,其发展受到很大的限制。其他的数据库主要还有金纬达网络信息检索系统、上海创新传统医药研究中心的SIRC-TCM 传统医药化学信息系统、中国中医研究院与浙江大学合作建设的中医药数据平台、中国科学院过程工程研究所的传统医药化学数据库、北京东方灵盾公司开发的传统药物专利数据库、中国科学院上海药物所与创腾科技公司合作开发的传统医药数据库、有关金纬达网络信息检索系统等。

国外发展现状主要有以下三种模式:

第一种类型是以美国为代表的整体弱化型,即美国的联机医学文献分析和检索系统MEDLINEMEDLARS on-line)。第二种类型是以日本、法国为代表的本土偏倚型,如日本特许厅的中草药网上信息。第三种类型是以印度为代表的本土专题型,即将本土是数据库和国际认可的检索系统相结合,使得国际上可以获取传统知识的权利人信息。包括印度国家科学普及局(NISCOM)和印度药品和疗法系统部(ISM&H)“传统知识数字图书馆(TKDL)”、非专利的“防御性公开数据库”。 传统知识数字图书馆(TKDL)是包括23 万个传统配方和疗法的数据库,其中包括传统医学疗法生命吠陀医学、通过古希腊传入印度的尤那尼医学、印度最古老的健康疗法之一悉达医学和瑜伽姿势等。印度语、梵语、阿拉伯语、波斯语、乌尔都语和其他语言转化为可检索的数字格式。系统支持英语、日语、法语、德语和西班牙语。审查递交的专利是不是印度医药学里已经广泛传播的 “传统知识 ”。 非专利防御性公开数据库抢先挖掘可专利的瑜伽技术,抢先申报专利2010年,CSIR项目已完成约900多个瑜伽姿势和功法的专利申请文件撰写工作。

四、结论

综上所述,根据我国传统知识的数据库建设现状以及国外的经验,我的观点是传统知识知识产权数据库应该兼具国家干预性、投资管理的可持续性以及产业利用的商业价值性。

我的发言完毕,谢谢大家!

主持人:

教授的研究借鉴日本、印度等国,给了我们很大的启示。下面有请李喜蕊

博士后就国内知识产权信息网络现状给大家进行一下解读。大家欢迎!

李喜蕊博士后:

在本课题中,我的任务是分析国外内知识产权信息网络现状,目前我以及将国内知识产权信息网络现状基本收集、分析完成,国外部分的研究尚在进行中,今天主要与大家分享我国国内知识产权信息网络现状。

《国家知识产权文献及信息资料库建设研究》信息收集的内容是国内的知识产权网站要求全面、系统地收集国内知识产权相关的网站,每一网站列出网址、举办者、沿革、主要栏目,简要介绍、内容特点等。在完成这些信息的收集后,我的成果是:《国内知识产权信息网络现状分析》的分析报告。我的研究思路是在收集网站的基础上分析信息,最终形成报告。

通过对国内知识产权网站信息的收集,我发现目前我国知识产权网站主要分为以下六大类:高校和研究机构的知识产权网站、知识产权相关政府机构的网站、法院系统知识产权网站、知识产权服务机构的网站、商业网站的知识产权模块、公共信息网络的知识产权模块。我将分别从这六类知识产权网站的具体包括的网站、主要信息资源和其主要特点三个方面展开具体的介绍。

一、高校和研究机构的知识产权网站

(一)12个高校和研究机构的知识产权网站

中国知识产权评论网;知识产权实验室;中国社会科学网知识产权专题;华东政法大学知识产权学院网 ;中国知识产权研究网等

(二)主要信息资源

共同资源:教学信息、科研成果、学术动态、专业讲座、研究资料、知产法规等

特色资源:法律资讯、信息港数据库、数字化教学平台、文泓知识产权读书会和学术讲座、知产监测、司法鉴定

(三)主要特点

1. 鲜明的教学研究特色

2. 信息不丰富,利用方式简单

3. 部分网站也进行了资源整合的尝试

二、知识产权相关政府机构的网站

(一)12个知识产权相关政府机构网站

国家知识产权局网站、中国商标网、中华人民共和国新闻出版总署网站、中国保护知识产权网、中国普法网、中国人大网、国家科学技术部网、香港知识产权署网等

(二)主要资源

政务信息、统计信息、专利检索系统、商标查询系统、法律法规数据库、法律释义与问答、粤港澳知识产权资料库

(三)主要特点

1.充分利用行政权限,数据全面,更新速度快,时效性强。

2. Internet形式提供信息服务,界面简单,使用方便

3.免费方式提供知识产权信息服务

4.不足:信息发布型、资源重复、查询检索功能比较简单

三、法院系统知识产权网站

(一)法院系统知识产权网站

中国法院网、中国知识产权裁判文书网、知识产权司法保护网

(二)主要资源

裁判文书检索、法律文库、案件库、法院公告查询

(三)主要特点

司法实务型、信息提供方式简单、基本免费、可全文利用

四、知识产权服务机构的网站

(一)知识产权服务机构的网站

中国知识产权网、中国专利信息网、中国专利信息中心、中国发明专利技术信息网、易信——中国专利文摘数据库、国家科技图书文献中心、国际版权网

(二)主要资源

中外专利检索服务平台、专利文摘数据库、文献翻译服务、中国失效专利数据库等

(三)主要特点

服务型、产品和服务介绍倾向、文摘免费,全文收费

五、商业网站的知识产权模块

(一)商业网站的知识产权模块

同方(CNKI)、北大法宝、万方数据知识服务平台、月旦法学知识库、北大法意

(二)主要资源

法律法规检索、相关文献检索、专利检索等

(三)主要特点

数据庞大,法律资源加工、检索方式简繁结合、文摘和全文的浏览和下载全部收费、专利检索数据库不如国家知识产权局专利检索数据库

六、公共信息网络的知识产权模块

(一)公共信息网络的知识产权模块

百度专利检索、GOOGLE

(二)主要资源

一般知识产权信息、专利检索

(三)主要特点

海量信息、检索简便、资源整合不够

七、总结:国内知识产权信息网络现状

从以上对六个类型的国内知识产权信息网站的具体分析,我们可以总结出国内知识产权信息网络建设的问题,主要包括以下四个方面:

(一)基本搭建了一个覆盖知识产权基本信息与服务的信息网络。

(二)基本处于信息的发布阶段,信息的增值分析(或服务)功能较差。

(三)信息资源重复建设严重,资源共享任重道远。

(四)对信息缺乏加工意识,信息的深层次加工十分欠缺。 

八、对比研究世界知识产权组织(WIPO)信息网站

世界知识产权组织(WIPO)信息网站是一个集知识产权信息资源、加工处理、知识产权机构于一体的全球化数字化信息网络,是一个先进的知识产权信息网站,值得我们借鉴和学习。

(一)机构交流平台。机构交流平台是WIPO 同其他知识产权机构加强交流的重要平台,同时依靠现有的全球化通信基础设施及其功能(电子信箱、电子列表服务、文件传输、知识产权讨论组等),将171个国家和地区的332个知识产权管理机构联结起来。

(二)信息加工、服务平台。其基本服务有: EmailWWW链接、网络传输、文档传递设施、WIPO远程会议、保密数据交换、电子邮件列表、WIPONET的帮助平台、软件支持

知识产权服务:链接知识产权数字图书馆、获取资源服务、通过WIPO 远程学院进行学习、仲裁中心、调研与证明工作。

九、下一阶段的工作

由于网站是数据库的一个搭建平台,所以我们有必要进行深入的对比研究,寻找我国存在的问题,因此我们下一阶段的工作主要是对国内知识产权相关的数据库分析,包括内容范围(全面性、系统性、科学性)、使用情况和社会反映、易检性、查全率、查准率;以及中外知识产权信息网络现状对比研究,包括存在的问题、现实的要求、完善的对策。

我的发言完毕,谢谢大家!

主持人:

谢谢李博士的演讲!她从政府、高校、个科研机构等方面探讨了我国知识产权网络信息服务的现状,但我发现她没有对老师的网站进行分析。老师的网站数据能持续及时地更新,确实相当不容易。下面发言的是付继存博士,其主题是“我国知识产权重大事件资料库建设的思路与对策”,大家欢迎!

 

付继存博士:

各位老师、各位同学,大家下午好!我在此课题中主要负责我国知识产权重大事件资料库的建设与研究。刚上来时,我心里很忐忑,因为这其中包括一个思路和对策的问题,不知道自己做的成果是否符合项目的要求,所以心里没底。但是今天上午听老师在讲他们的经验,还有下午老师在讲我国需求的现状的时候,我感觉我们现在的总体思路是正确的。今天,我要汇报的是如下四个方面:(1)重大事件的信息分布现状;(2)重大事件资料库的建设原则;(3)重大事件的信息加工;(4)重大事件资料库设想。

引言:重大事件资料库定位与价值

关于重大事件,我们将其定位为服务于学术研究,因为对于法律的历史发展过程,往往是研究人员比较关注。针对研究人员的需求,我们要掌握两点:一是减少他们的生活成本。我们在做课题的过程中总是想着如何对原始信息进行加工,以方便研究人员的使用。上午老师在讲澳门法律时讲到条文检索,但是这其中不包含纵向的检索。我们按照某一主题,如将1904年到2001年的关于商标的主题全部给大家呈现出来。这样可以更好地减少他们的检索成本。二是同时将原始文献予以呈现,以方便某些人员的研究。所以,我做了如下层次划分:最外围是信息资料,即原始文献。往里是提供信息产品,这主要是对加工之后的信息的利用。如对我国商标发展近一百年来的研究。我们最终的目标是商用。

一、重大事件的信息分布现状

我们在搜集信息时在九十年代分前后两个时期,在九十年代前所搜集信息的特点是:载体纸质化、载体分散化、信息初始化、信息沉淀(是经过时间过滤的,影响比较大的信息)。九十年代后信息的特点是:载体电子化、载体分散化、信息初始化、信息嘈杂。在搜集中,由于信息比较分散和嘈杂,我们判断重大事件的标准是以重大标志性的事件为基础,看所搜集的信息是否是我们所需要的。

我们搜集信息的信息源主要有以下几个:书籍、专业期刊、会议综述、公开网站和内部资料。其中,内部资料是比较难找的。在其中,书籍主要包括:《中国当代版权史》、《中国商标法律史》、《枪口下的法律》、《中国专利法的孕育与诞生》、《中国近现代专利制度研究》、《知识产权年鉴》、《中国版权史研究资料》、“19501953年法令汇编”。这些资料的特点是突出史学类的研究,主要给我们提供的是信息点,对于某些具体的信息,有些还需要查找原始文献。期刊类主要包括:《中国专利与商标》、《著作权》、《中华商标》、《电子知识产权》、《知识产权》、《中国知识产权报》。所搜集的网站主要有:北大法宝数据库、中国知网数据库、政府网站和百度等搜索引擎。所搜集的会议综述有:20012005知识产权法学研究的回顾与展望,全国部分省市法院知识产权审判研讨会综述,中国知识产权法学三十年、二十年。总体来说,在信息搜集过程中,主要有两问题:一是资料内容有不同的特点,九十年代前主要是立法资料、外交及学术信息少,有信息条没具体内容;二是在“重大”标准的界定上,九十年代前只要能呈现出来的即为重大的,九十年代后以标志性事件为重大事件。

二、重大事件资料库的建设原则

在资料库的建设中,我们所遵循的原则主要有以下四个:以服务用户为基本目标,以标志性事件为主线,以知识产权分类为基本结构,以标志性事件为中心建立信息体系。对于标志性事件,此处举例说明。以在商标方面从1904年到1982年的立法(立法一般为标志性事件最高级的表现形态)为例,有:1904年商标注册试办章程、1923年商标法、19301935年商标法、1950年商标注册暂行条例、1963年商标管理条例、1982年商标法及其三次修改。

然后按照表一所示维度来查找这些标志性事件所发生的背景及相互影响,以标志性事件为基础建立一个信息群。这也为我们下一步的标引提供了思路。在这几个原则中,用户需求导向的主要过程表现为:问卷调查→信息收录→信息标引→信息检索→用户中心。但此不是我们现在的重点。我们现在主要在做资料搜集与整理这一块。

表一:信息体系建构模式                   

 

总论

著作权法

商标法

专利法

其他

立法、政策

 

 

 

 

 

执法管理

 

 

 

 

 

司法

 

 

 

 

 

海关、贸易

 

 

 

 

 

外交

 

 

 

 

 

学术研究

 

 

 

 

 



三、重大事件的信息加工

我们信息加工的两条对策是数据流模型和信息标引。信息标引已有我们的几位专家论述,我在此不再赘述。关于数据流模型,主要是指我们对一次信息即原始信息采取免费的方式;对二次信息即定型化的信息采取付费的方式;对三次信息即定制的信息采取收费的方式。关于信息标引,我们主要从以下方面着手:一是人工标引能够充分体现用户需求,二是自动标引可以提高工作效率,三是按照课题现有分类及代码进行标引。

四、重大事件资料库设想

对于我们的数据库,主要由一次信息、二次信息和定制互动平台提高检索而构成。此处有两个举例。例一:在数据库中输入“注册制度”,数据库将呈现以下内容:1904年商标注册试办章程第167条;1923年、1930年、1935年商标法第1条;1950年、1963年商标注册暂行条例与商标管理条例第第2条;1982年及其后商标法第345条。同时,数据库还会有深度的链接,链接到相应的立法背景,来提供一个纵向的数据库。例二:通过某一司法案件的案情地图,方便大家对案件的了解。同时,对案件中所涉及的法学理论上的问题提供链接,来提供一个横向的数据库。这就是我们对重大事件数据库的整体设想。

我的发言到此结束,不足之处,请各位专家多多指正!

主持人:

上午很多专家都在讨论云计算,讨论未来数据库的建设模式,刚才付继存博士把我们的设计拉到了百年以前。他所讲述的很多知识产权发展史上的重大事件非常重要。在这样一项困难艰巨的工作中,我看到了杨利华老师在其中的努力。据我了解,人大在清史稿的整理中就投入了几千万,以我们的资金能力,能将知识产权重大事件的资料整理到这种程度确实非常不容易。但,这一方面对于学术研究及知识产权事业的发展确实非常有用。若有什么问题,自由辩论环节我们再来讨论。下一位发言者是来自国家知识产权局专利复审委诉讼处的何伦健,大家欢迎!

何伦健:

对于数据库的建设,我了解不是很多,这次会议对我来说也是一次学习的机会。我的日常工作是对专利复审无效的审查,以及复审委的一些诉讼活动。从量上来说,随着专利申请量的不断增加,专利复审无效的数量也在不断增加。复审的案件,在2000年,也就两千多件,2008年增加到八九千件,到2010年受理量已经突破了一万件。无效的案件,从2001年开始逐渐增加,近几年保持在两千到两千五百件之间。关于复审无效有关的判决方面的数据,现在每年能收到将近一千件的判决。这其中包括一审、二审及少量的再审判决。这一块数据主要表现于复审决定和无效决定。决定有两个部门组成,一是注入项目的部分,就是我们要检索决定时的标引项。二是正文部分,包括案由、决定理由及结论。如果是外观设计的话,可能还有些不同。

对于目前这一块服务的现状,复审决定和无效决定的检索主要是对内的工作方面的检索服务。一个是E系统,它采用的Oracle数据系统,Unix操作系统。还有一个是决定检索数据库。此库可以在外网检索,但数据不是很全,限于2009年之前。总体来说,还是比较初级的检索,已经引起复审委的重视。主要存在的问题有:现有公开的数据较少,没有一个良好的激励机制。

关于这个课题,我认为一方面要重视与行政部门的沟通协调,探索创新与他们的合作模式。由于政府部门掌握的资源较多,这比较有利于我们数据库信息资源的获取及使用。另一方面,政府部门掌握了很多资源,但不知道如何利用;而公众对资源的利用又有一种需求。这就造成了这样一种矛盾。所以,我觉得,解决这方面的问题是否也是我们这项课题内容的一部分。

我就讲这么多吧,谢谢大家!

主持人:

谢谢何伦健!下面有请贺利云博士进行一下点评。

贺利云:

今天所讲的信息采集、信息管理等方面的知识,让我一个学法之人的思路有一种豁然开朗的感觉,让我看到了这项重大课题的广阔前景!关于这个课题的讨论,我一般站在规范的层面进行思考。现在发现今天的讨论其实是整个课题的一个体系。关于这个课题的思考,主要有以下几个方面:一是知识产权文献的建设定位是公共信息还是商业信息?还是一部分是公共信息,一部分是商业信息?在信息的公开方面,国家还有很多缺陷,不透明。二是文献的定位问题。就是哪些是应该由政府投入的,哪些是应该由市场参与的?政府在这一方面可订立几个原则,如为科技创新进行信息的投入建设。我认为,国家应该投入的是基础信息和战略信息,对于深加工的信息应该是商业化。三是对专项研究方面。不同的分类得出不同的结论。项目中,对于重大事件的研究是非常好的点。之后,可以进行对专项的进一步分类。

主持人:

谢贺利云博士!下面进入自由讨论阶段。

李喜蕊博士后:

我说一下关于冯老师的个人网站“冯晓青知识产权网”的问题。刚才在发言中没有提及是因为我找来找去,发现国内就只有这一个个人的知识产权专业信息网站。该网站包括主站和子站,是一个融合专业信息及个人信息的综合性网站。在下一步的研究中我将就其与国外的一些个人网站进行一下对比。还有就是,关于知识产权的博客非常多,但内容非常随意并且不太学术,所以我们也可以讨论一下我们的信息资料库中要不要纳入博客这一问题。

刘友华老师:

我想谈一下对重大历史事件的研究。这一研究虽然意义重大,但是考虑到我们项目的有限性以及公众对这方面的信息需求较少,我觉得这一方面可能比较难经受市场的挑战,进行商业化的推广。

杨利华老师:

我来回答一下老师的问题。把知识产权网站定位为商业性,重大事件最没商业价值的,但是我们在高校中,对于了解来龙去脉有很大的帮助,其价值还是不容忽视的。

肖冬老师:

说到重大事件的商业价值较少,我恰恰认为相反。一方面,在专利分析上,重大事件对规则的了解,在专利信息分析上会有很大的启示,对于数据分析会非常关键。另一方面,这对于企业的也是至关重要的,如在新颖性标准的修改方面。

刘友华老师:

较其它数据库来说,这一方面的商业价值可能会小一些。但我并不是说这一研究没有价值。我认为这一块的研究意义还是挺大的。这其中也反映了老师对于此项课题的认真态度,值得我们学习。

 

 

 

会议总结(闭幕)

冯晓青教授:

听了这些报告我收获很大,也有了更新更全面的认识。利用最后的总结我就讲一下这么几点:

第一点:感谢。首先感谢在座的各位,特别是我们的专家、老师、同事和在京的特别是参加这个课题的课题组的成员。我也感谢我们在座的同学。除了我跟老师的学生,别的老师的学生也参与了课题,做了很多工作。也感谢我们的单位和学校都对我们这个课题给了很多关心和支持。对参与我们这些7000多份的调查问卷的人员,我也表示感谢。

第二点:对于这次研讨的内容我做一点点回应和思考。我们的研讨分为四个专题,曾部长和肖教授都提出来很精彩的观点,给我们很大的启发。他们从很高的角度对我们这个课题,如专利文献资源资料库的建设等提出了很多建设性的意见。

对于研讨的内容,对于资料库的建设,各位都提了很好的观点和见解:

湘潭大学的教授对我们文献与资料库的标引方面给了我们很多指导。

武大的两位教授主要是从知识产权信息的增值和数据库的构建,以他们正在做的比较充分的澳门的法律数据库的成果为摹本提出启发和经验。他们对我们的资料库的定位和怎么做提供了范例,有很好的指导意义。

教授主要是从资料库建设的方案和设计思路这两个方面提出建议。

清华大学的教授的课题尽管不是专门针对我们知识产权数据库建设,但我觉得他也给我们提供了非常好的建设思路,非常前沿,在网络、知识分享、知识传播和利用方面提供了非常前沿的理论和思想,对于我们课题的研究有很好的启发。

博士是从科云网的建设提供了非常好的思路,也是比较先进的、前瞻性的网络技术来构建这样一个目前为止法律资源方面最大的数据库,提供了比较好的思路。

调研方面主要是各位对于调研情况做了一些信息介绍和分析,从实证的角度给我们提供给了比较好的第一手的资料,最现实的实证的一些研究成果。

张冬教授提醒我们对传统知识的考虑,在国际知识产权方面,我们应当把这部分加进去。她的演讲也给我们启发,启发我们考虑非物质文化遗产的保护和数据库构建。

其他几位,李喜蕊博士后主要对国内的知识产权网络现状进行了研究和梳理。付继存博士也是对重大事件进行了总结。何伦健主要是对专利复审这部分的比较保密的信息跟我们分享。我国现在知识产权信息有个比较奇怪的现象,就是很多信息不公开。为什么信息不愿意公开?为什么不能下载、复印?我觉得可以商榷,因为这些本来就是公用信息。我们的课题往下走还要克服很多困难。还要与相关政府部门进行协调。

第三点,展望。对2012年的展望,不是很成熟,但也是初步考虑。第一个在研究队伍方面,希望各位教授参与我们课题的研究。第二点我说一下我们进一步推进的意见,几点不成熟的意见。资料的收集整理分析加工还要进一步的推进。我们从下一步更加完善的角度来讲,我们要进一步梳理。内容不是很充实,我们要进一步充实信息。对现有的内容,我们还不是很全面,比如说贸易信息、版权信息、商标确权信息、植物新品种的、林业还有传统知识和非物质文化遗产。我们还有很多专项需要追加和补充,还有未来数据库资料本身的填充。

对于样板的资料,我们下一年度会进行补充,将涉及5000个不同类型、不同地区的、不同时间的知识产权案件,要有代表性,还要分散,要筛选,筛选要有一定原则。然后要研究标引的方法,对筛选出来的未来做数据库的资料进行标引。要标引首先要进行研究,确定自己的原则、思路、方法。再有一点就是要进一步研究资料库建设方案的构建和技术的实现,这是我们下一年的重点。

今年的调研是书面的,下一年,2012年还会进行实地调研。我们要去比如专利局、国家知识产权局、知识产权出版社等一系列涉及知识产权的机构进行调研,还有公益性知识产权机构和商业性知识产权数据库单位等。实地调查与问卷调查肯定不一样。

这是大致的想法,不是很成熟,也希望大家对我们这样一个课题下一年度怎样推进提出宝贵意见。关于刚刚提到的我的个人知识产权网站(冯晓青知识产权网),目前这类网站我国可能只有一个,我准备在我的网站中间显要的位置建立国家社科基金重大项目的一个专版。计划在12月份左右进行改版,设立专栏和邮箱,大家如果有好的思想观点、信息和资料,可以通过专栏交换意见。这也是我的网站提供给大家研讨的一个平台。

我主要总结这几点,最后再一次感谢大家出席。会议到此结束。

 

相关文章
“国家知识产权文献及信息资料库建设研究”2015年度工作会议暨学术研讨会成功举行
国家社会科学基金重大项目“国家知识产权文献及信息资料库建设研究”开题暨首次学术研
网站创始人
个人简介:(学术)
中国政法大学教授、博士生导师
知识产权法研究所所长、无形资产管理研究中心主任
北京大学法学博士
中国人民大学法学博士后
邮箱:fengxiaoqingipr@sina.com
北京市海淀区西土城路25号中国政法大学知识产权法研究所
个人简介:(实务)
最高法院案例指导工作专家委员会委员
最高法院知识产权司法保护研究中心首届研究员
中欧仲裁中心仲裁员
深圳、南京仲裁委员会仲裁员
北京天驰君泰律师事务所律师
中国律协知识产权专业委员会委员
中国审判研究会知识产权审判理论专业委员会委员
热点文章排行
联系我们更多>>
通讯处:(Zip:100088)
地址:北京市海淀区西土城路25号中国政法大学知识产权法研究所(Zip:100088)
点击进入免费咨询>>

冯晓青教授◎版权所有2012-2015  All rights reserved  备ICP证号:京ICP备12039890号

地址:北京市海淀区西土城路25号中国政法大学知识产权法研究所(Zip:100088)

技术支持:律师营销网  您是网站第位访客