怎么找出两个文本相似的部分啊

[复制链接]
查看11 | 回复2 | 2021-1-27 06:48:27 | 显示全部楼层 |阅读模式
就是文本a中有部分字符文本b中也有出现,怎么获取这部分内容用python实现,类似论文查重那样把相似部分单独输出
分 -->
回复

使用道具 举报

千问 | 2021-1-27 06:48:27 | 显示全部楼层
https://images2018.cnblogs.com/blog/1358881/201808/1358881-20180816144716135-2034557332.png
回复

使用道具 举报

千问 | 2021-1-27 06:48:27 | 显示全部楼层
论文查重那样,找出文本a中和其他数据文本相似的部分,单独获取出来,结巴分词是找相同词的,我想找相似的部分,但是difflib库和Levenshtein库都试过了,匹配的不是很好
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行