- 博客(0)
- 资源 (1)
- 收藏
- 关注
自然语言标注:用于机器学习(英)
是时候创建属于你自己的用于机器学习的自然语言训练语料库了。无论你使用英语、汉语或者其他任何一种自然语言,《自然语言标注——用于机器学习(影印版)》都可以手把手地指导你一种经验证的标注开发周期——把元语添加到你的训练语料库中来帮助机器学习算法更有效工作的过程。你无需任何编程或者语言学方面的经验就可以上手。
通过每一步中的详细示例,你将学到“标注开发过程”是如何帮助你建模、标注、训练、测试、评估和修正你的训练语料库。你也将了解到一个实际标注项目的完整演示。
在收集你的数据集(语料库)之前定义一个清晰的标注目标
学习用于分析你的语料库中语言内容的工具
搭建用于你的标注项目的模型和规范
检查从基本的xml到语言标记框架这样一些不同的标注格式
创建适合于训练和测试机器学习算法的黄金标准语料库
选择用来处理你的注标注数据的机器学习算法
评估测试结果并修正你的标注任务
学习如何使用用于标注文本和调整标注的轻量级软件
2013-10-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人