回答:
1. 相似度达到70%以上会被判定为重复。
2. 这是因为在文本相似度计算中,通常采用的是余弦相似度算法,当两个文本的余弦相似度达到70%以上时,就可以认为它们的相似度比较高了。
3. 如果需要避免文本重复,可以采取以下步骤:
1)使用不同的词汇表达同一个意思,避免直接复制粘贴;
2)对于引用他人的内容,要注明出处,并进行适当的改动;
3)使用专业的查重工具进行检测,避免遗漏。
相似的为百分之七十就应定位重复。连续重复13个字符也就是6-7个字算重复。如果需要引用别人论文的观点,超过13个字符的,可以标注引用,是不算重复率的。