您的当前位置:首页正文

实习总结报告

2020-09-04 来源:客趣旅游网
 实习总结报告

——黑马校对的优缺点

黑马校对是采用国际计算语言先进的语法分析和语料库统计相结合的方法,具有汉语切分技术、汉语语法分析技术、汉语依存关系分析技术等优秀的中文智能技术。内嵌79个专业词库、4800万条专业词汇、450万条错误核心库,查错准确率和校对效率已经达到一个崭新的高度。

在校对一个文件时,黑马文件可以将一篇一万两千字左右的文章在三分钟左右标记出223处错误。能够区分中文肯定性错误与需要人工判断的地方,并用不同的颜色进行标记,既能够节省大量时间和精力,又可以提高准确率。而且这种准确率是可以同时很好地体现在字词、拼音、英语、计量单位、古文、近现代文方面的。这是黑马校对最大的优点。

黑马软件整体采用人机结合的方式,是一个功能性很强的校对辅助工具。它具有明确的优势,首先在校对黑马word版时,能够同时校对一个文件中存在的各种错误,也可以单独校对标点、重句、科技计量等错误。也可以在校对多个文件时,采用批量校对的方式。对于字词的校对中,中文肯定性错误会默认用红色标记,还有数字、异形词、领导人称谓、领导人排序和涉台的政治性错误也会被标记成红色,同时拥有中文错误的出处和修改意见。例如文章中的一段内容:“展厅频临大街,车来人往,穿流不息,但队伍始终井然有序,那么安详,那么宁静,而又那么热烈,那么虔诚。无论是满头飞霜、精神矍烁的和霭长者,还是稚气盎然、连排队也不忘嘻戏的顽皮学童,他们的年令虽然悬殊,却都有着一颗爱书的心。”在这段中有多处字词错误,当使用黑马校对并提出修改意见后,上文的错误会被修改过来,如濒临、川流不息、矍铄、和蔼、嬉戏、年龄。而粉色标记的中文疑错词可能并不错误,需要人工进行判断。这样就可以节省很多人工校对的时间和精力了。而对于标点的校对如文中“总之,要想,你们若不负责,那么,负责的是已死的祖宗呢?未生的儿女呢?作证婚介绍的某博士某先生呢?拉皮条牵线的张家婶李家母呢?”在这段文中,经过黑马校对后,其中的前三个问号都被标记出来了,而随后也提出了修改意见。将前三个问号改为逗号。

在数字、拼音、英语校对中,错误一般被标记成红色,也有一些标记成粉色,红色标记的错误可能较大,不过对于英文的生僻人命、地名和缩略语等,有时可能会被误报。这也是黑马校对中的一个不足之处。尽管黑马校对能够节省很多人工校对时的时间与精力,而且正确率非常高,但也存在未标记或标记错误的情况。如文中“过去有关中国近代绅士的研究,大抵离不开张仲礼在《中国绅士》(The Chinese Gentry:Studes on ther Role in Ninetenth-Century Chinese Society)一书中所划定的范畴。其中所讲的绅士,是指地方上一些在政治、经济及社会上有特权的利益阶级,英文译作gentry。而本文所指的洋绅士(gentleman),则是西洋产品,在传统中国社会上并没有这类东西。”其中的Studes和Ninetenth都被进行了红色标记。出现这种情况也可以说是不可避免的,毕竟任何机器校对都不能代替人工校对,黑马软件也仅仅是作为人工校对的一个辅助工具,采用人机结合的方式,能够更好的保证正确率。

在进行古文校对时,能够同时对文字和拼音进行校对。但是正确率是比不上现代文校对的。所以大部分古文中错误都会被标记成粉红色,这就需要进行人工的再次检验,看是否标记正确。如《醉翁亭记》中“其西南诸峰,林壑(hé)尤美。

望之蔚然而深秀者,琅琊(láng yà)也。”其中“壑”字读音为he的去音,也就是第四声。而标记时,由于不能确定是字错误还是拼音错误,所以标记为粉色。也就是说在进行古文校对时,肯定性是有所下降的。黑马还能够进行病句校对、板式校对。

黑马还具有以下多种功能。黑马校对本身包含大规模的专业词库和核心错误词库,可以满足绝大多数的校对。用户甚至可以在此基础上添加新的词汇,以进一步扩展校对软件的词库量。我们可以添加新词。因为在校对时,可能会有一些特殊的专业名词由于无法识别而被误导,或者有一些黑马认为是错误,但我们认为不必标记的词,我们就可以将这些此条加入到用户库中,以后如果再遇到这些此条,系统就会认为这些词条是正确的词条了。还可以定义错词。新的文字错误总是不断涌现,为了实践更高的查错准确率,我们可以把新的文字用法错误、需要重点检查的词条和校对系统漏差的错误定义成错误词,这样系统就能在校对时把这些此条标记成红色了。

黑马校对优势与劣势都是明显的,但优势还是远大于劣势的。黑马校对是一个很好的校对辅助工具。

因篇幅问题不能全部显示,请点此查看更多更全内容