当前位置:首 页 > 服务范围 > G部--物理

一种自动提取中文文本关键词的方法与装置
添加时间:2023-07-31 浏览次数: 64

专利号:2019104818638

本发明公开了一种自动提取中文文本关键词的方法与装置,该方法包括:首先对文本进行中文分词和去除停用词;然后将单词转化为词向量,然后统计词频,通过词频和词语相似度计算单词在文本中的权重;然后构建基于图模型的文本排序算法,多次迭代计算出顶点得分;并且每次迭代计算过程中对关键词合并,并在图模型中添加新顶点并计算得分,然后对顶点得分进行排序,得分最大的为文本中最重要的关键词,本发明可实现中文文本关键词的准确提取。

友情链接
FRIENDSHIP LINK
惠企知识产权研究院    
联系电话:0631-5166712 联系地址:山东省威海市火炬高技术产业开发区火炬路169-1号202室内 联系邮箱:weihaihuicheng@163.com
版权所有:山东惠诚睿智知识产权有限公司 鲁ICP备2023018370号-1