《面向机器学习的自然语言标注》中英文PDF

作者James Pustejovsky Amber Stubbs
Natural Language Annotation for Machine Learning: A Guide to Corpus-Building for Applications
创建你自己的面向机器学习的自然语言训练语料库

创建您自己的自然语言训练语料库以进行机器学习。无论您使用的是英语,中文还是其他自然语言,这本动手手册都将指导您完成一个经过验证的注释开发周期,即将元数据添加到训练语料库以帮助ML算法​​更有效地工作的过程。您不需要任何编程或语言学经验即可上手。

通过每一步的详细示例,您将了解MATTER注释开发流程如何帮助您对训练语料库进行建模,注释,训练,测试,评估和修订。您还将获得有关真实注释项目的完整演练。

在收集数据集(语料库)之前定义明确的注释目标
学习用于分析语料库语言内容的工具
为注释项目建立模型和规范
检查不同的注释格式,从基本XML到语言注释框架
创建可用于训练和测试ML算法的黄金标准语料库
选择将处理带注释的数据的ML算法
评估测试结果并修改注释任务
了解如何使用轻量级软件来注释文本和裁定注释
这本书是O’Reilly使用Python进行自然语言处理的完美伴侣。

下载地址


提取码: