- 博客(0)
- 资源 (7)
- 收藏
- 关注
中国地方政府数据开放平台报告(2017)
随着我国信息化发展水平的日益提高,对数据资源的采集、挖掘和应用水平也不断深化。根据工信部发布的《大数据产业发展规划(2016-2020年)》,我国政务信息化水平不断提升,全国面向公众的政府网站达8.4万个。智慧城市建设全面展开,“十二五”期间近300个城市进行了智慧城市试点。
2018-09-10
NLPIR-ICTCLAS分词系统开发手册2016版
词法分析是自然语言处理的基础与关键。张华平博士在多年研究工作积累的
基础上,研制出了NLPIR分词系统,主要功能包括中文分词;英文分词;词性标
注;命名实体识别;新词识别;关键词提取;支持用户专业词典与微博分析。NLPIR
系统支持多种编码(GBK编码、UTF8编码、BIG5编码)、多种操作系统(Windows,
Linux , FreeBSD 等所有主流操作系统)、多种开发语言与平台(包括:
C/C++/C#,Java,Python,Hadoop 等)。
2018-09-10
清华大学开放中文词库
THUOCL(THU Open Chinese Lexicon)是由清华大学自然语言处理与社会人文计算实验室整理推出的一套高质量的中文词库,词表来自主流网站的社会标签、搜索热词、输入法词库等。THUOCL具有以下特点:
包含词频统计信息DF值(Document Frequency),方便用户个性化选择使用。
词库经过多轮人工筛选,保证词库收录的准确性。
开放更新,将不断更新现有词表,并推出更多类别词表。欢迎专业人士加入,协作建设开放词库,有意者请致信[email protected]。
该词库可以用于中文自动分词,提升中文分词效果。建议搭配本组研制开发的THULAC工具包使用,提升特定领域中文分词的效果。
2018-09-10
spring4+hibernate4+activiti5
核心框架:Spring 4.1.0.RELEASE
视图框架:Spring MVC 4.1.0.RELEASE
Ajax交互框架:Dwr 2.0.3
持久层框架:Hibernate 3.3.2.GA Spring Jdbc 3.1.2.RELEASE
数据库连接池:proxool 0.9.1
工作流引擎:Activiti 5.16
任务调度:quartz 1.7.2
日志管理:SLF4J 1.7.2、Log4j 1.2.17
邮件管理:Mail 1.4
模板引擎:Freemarker 2.3.20
工具类:pinyin4j 2.5.0(中文拼音转化)、jxl 2.6.12(Excel处理)、jsoup 1.7.2(Html解析)、json-lib 2.3(json处理)、cos 05Nov2002(上传组件)
2015-08-11
Java操作XML编程实例解析.doc
在XML应用中,最常用也最实用的莫过于XML文件的读写,所以笔者通过一个简单的XML文件读写来作简要分析。可以在任何文本编辑器中先建立如下结构的XML文件,类似于HTML结构,但XML语义比较严格,起始标记必须配对,
2010-09-19
J2EE完全参考手册-J2EE概述-pdf.pdf
为了快速设计和开发企业级的应用程序, Sun 公司推出了一种全新概念的模型——Java 2 Platform, Enterprise Edition(J2EE)
J2EE完全参考手册
2010-09-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人