Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
複数のXML文書の類似性検出システム、および、複数のXML文書の統合システム
Document Type and Number:
Japanese Patent JP4992072
Kind Code:
B2
Abstract:

To provide a similarity detection method and an XML document integration method and system for highly precisely detecting the similarity of a plurality of XML documents at a high speed and at low costs.

The similarity detection method of an XML document and the integration method and system of the XML document includes a stage (A) configuring one XML document Tb and the other XML document Tt into the maximum partial tree structure having independent meanings; a stage (D) for collating the leaf node cluster of a partial tree configuring the XML document Tb with the leaf node cluster of the partial tree configuring the XML document Tt, and for obtaining the similarity of the partial trees based on the rate of the number of leaf nodes having the same contents between the leaf node clusters to be collated and a stage (C) for obtaining the similarity of the XML documents from the similarity of the partial tress.

COPYRIGHT: (C)2007,JPO&INPIT


Inventors:
Haruo Yokota
Liang Wenxin
Application Number:
JP2005236039A
Publication Date:
August 08, 2012
Filing Date:
August 16, 2005
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
National University Corporation Tokyo Institute of Technology
International Classes:
G06F17/30; G06F17/21
Domestic Patent References:
JP2000105769A
JP2004348341A
Other References:
小西 一也 他,異種情報源統合におけるXML構造統一化手法,情報処理学会研究報告,日本,社団法人情報処理学会,2002年 7月17日,第2002巻第67号,p.139-144
絹谷 弘子 他,キーワードを利用したXML文書検索,情報処理学会論文誌 第45巻 No.SIG7(TOD22),日本,社団法人情報処理学会,2004年 6月15日,第45巻,p.255-273
濱崎 雅弘,階層的知識と内容的類似性を用いたインターネットディレクトリの統合,2003年度人工知能学会全国大会(第17回)論文集,日本,社団法人人工知能学会,2003年 6月27日,第17回,p.1-4
波多野 賢治 他,情報検索技術による構造化部分文書の抽出法,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2001年 7月12日,第101巻第193号,p.135-142
Attorney, Agent or Firm:
Isono Dozo



 
Previous Patent: JPS4992071

Next Patent: JPS4992073