- 博客(1)
- 收藏
- 关注
翻译 Extracting, transforming and selecting features - spark.ml
本节介绍了处理功能的算法,大致分为以下几组: 提取:从“原始”数据提取特征 转换:缩放,转换或修改要素 选择:从一组较大的要素中选择一个子集 Feature Extractors TF-IDF (HashingTF and IDF) 字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。 词频率-逆文档频率(
2017-01-17 10:49:38 427
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人