专利名称:使用文本分析从源文档中识别相关文档集合的系统
和方法
专利类型:发明专利
发明人:史蒂芬·凯恩·鲍伊尔,杰弗里·托马斯·克鲁伦,威廉·斯
科特·斯班格勒,塔帕斯·卡努恩格,罗伯特·李·安格尔,詹姆斯·J·罗德斯,赫什尔·J·R·韦恩斯特劳布,大卫·C·马丁,里查德·亨尼西,詹姆斯·威廉·库伯
申请号:CN200610110127.4申请日:20060731公开号:CN1967535A公开日:20070523
摘要:一种用于处理文档以便生成相关文档集合的系统和方法。提供了这样一种系统,其包括:文本分析系统,用于分析包含在源文档中的非结构化数据并且提取关于源文档的结构化信息集合;以及比较系统,用于通过比较结构化信息集合与根据出版物集合索引的元数据来识别相关文档集合。
申请人:国际商业机器公司
地址:美国纽约
国籍:US
代理机构:中国国际贸易促进委员会专利商标事务所
代理人:吴丽丽
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容