《面向机器学习的自然语言标注》中英文PDF


作者James Pustejovsky Amber Stubbs Natural Language Annotation for Machine Learning: A Guide to Corpus-Building for Applications 创建你自己的面向机器学习的自然语言训练语料库 创建您自己的自然语言训练语料库以进行机器学习。无论您使用的是英语,中文还是其他自然语言,这本动手手册都将指导您完成一个经过验证的注释开发周期,即将元数据添加到训练语料库以帮助ML算法​​更有效地工作的过程。您不需要任何编程或语言学经验即可上手。 通过每一步的详细示例,您将了解MATTER注释开发流程如何帮助您对训练语料库进行建模,注释,训练,测试,评估和修订。您还将获得有关真实注释项目的完整演练。 在收集数据集(语料库)之前定义明确的注释目标 学习用于分析语料库语言内容的工具 为注释项目建立模型和规范 检查不同的注释格式,从基本XML到语言注释框架 创建可用于训练和测试ML算法的黄金标准语料库 选择将处理带注释的数据的ML算法 评估测试结果并修改注释任务 了解如何使用轻量级软件来注释文本和裁定注释 这本书是O’Reilly使用Python进行自然语言处理的完美伴侣。

下载地址



提取码:

下载地址: