专利名称:一种将非结构化文本转化为结构化文本的方法及装
置
专利类型:发明专利发明人:朱晓峰,王加丽,金蕾申请号:CN201911218187.1申请日:20191203公开号:CN110955714A公开日:20200403
摘要:本申请实施方式公开了一种将非结构化文本转化为结构化文本的方法及装置。所述方法包括:获取非结构化文本;所述非结构化文本包含不同层级的标签;根据所述非结构化文本创建配置文件,所述配置文件包含所述非结构化文本中的指定标签与结构化文本的关联关系;根据所述配置文件,确定与所述指定标签所在的标签链相关联的结构化文本;所述标签链由所述不同层级的标签构成;根据所述非结构化文本,确定所述标签链的出现频次以及所述标签链对应的数据;根据所述标签链的出现频次,将所述标签链对应的数据,写入与所述标签链相关联的结构化文本。本说明书实施例提供的方法可以适用于不同的非结构化文本,提高了复用性。
申请人:中国银行股份有限公司
地址:100818 北京市西城区复兴门内大街1号
国籍:CN
代理机构:北京三友知识产权代理有限公司
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容