国科大/中科院-网络数据挖掘-徐君-大作业-垃圾短信识别系统设计-监督学习-分类-报告+数据+代码
国科大 徐君 网络数据挖掘 大作业
个人报告+代码+数据,可参考
README
运行环境:
Python 2.7.12
jieba 0.39
numpy 1.13.3
scikit-learn 0.19.1
scipy 1.0.0
请参照此运行环境进行运行前配置。
1.运行TextProcess.py获得classifiedLabel.txt、trainSetMsg.txt以及testSetMsg.txt,得到文本处理后的规则文本数据文件;
2.运行crossValidation.py进行交叉验证;
3.其中SVM算法运行时间较长(6-7小时左右),可以注释掉或者减少数据规模来测试;
4.可调用分类器中的predict方法来利用训练后的分类器进行分类预测(垃圾短信识别)。
计算机视觉-模型、学习和推理-Simon J. D. Prince-完整-有书签-可高亮
计算机视觉
作者: Simon J. D. Prince
出版社: 机械工业出版社
副标题: 模型、学习和推理
原作名: Computer Vision: Models, Learning, and Inference
译者: 苗启广 / 刘凯 / 孔韦韦 / 许鹏飞
出版年: 2017-6
页数: 442
完整,主要章节有书签,已OCR识别,可高亮
计算机视觉-算法与应用-Richard Szeliski-英文版-有书签-可高亮
Computer Vision
作者: Richard Szeliski
出版社: Springer
副标题: Algorithms and Applications
出版年: 2010-11-24
页数: 832
有书签,无加密,可高亮。
计算机视觉-算法与应用-Richard Szeliski-中文版-有书签-可高亮
计算机视觉
计算机视觉
作者: Richard Szeliski
出版社: 清华大学出版社
副标题: 算法与应用
原作名: Computer Vision: Algorithms and Applications
译者: 艾海舟 / 兴军亮
出版年: 2012-1
页数: 866
主要章节有书签,已OCR识别,可高亮。
深度学习与计算机视觉-算法原理、框架应用与代码实现-叶韵
深度学习与计算机视觉
作者: 叶韵
出版社: 机械工业出版社
副标题: 算法原理、框架应用与代码实现
出版年: 2017-7-25
页数: 344
有书签,已OCR识别,可高亮。
精通正则表达式-Jeffrey E·F·Friedl第3版-中文版
精通正则表达式
作者: [美] Jeffrey E·F·Friedl
出版社: 电子工业出版社
副标题: 第3版
原作名: Mastering regular expressions
译者: 余晟
出版年: 2007
页数: 515
有书签,已OCR识别,可高亮。
线性代数及其应用-莱(Lay D.C.)-中文版
线性代数及其应用
作者: (美)莱(Lay D.C.)
出版社: 机械工业出版社
副标题: (原书第3版)
原作名: Linear Algebra and Its Applications
译者: 刘深泉 等
出版年: 2005-8-1
页数: 496
本书主要内容包括线性方程组、矩阵代数、行列式、向量空间、特征值与特征向量、正交性和最小二乘法、对称矩阵和二次型等。此外,本书包含大量的练习题、习题、例题等,便于读者参考。
有书签,已OCR识别,可高亮。
编码-隐匿在计算机软硬件背后的语言-查尔斯•佩措尔德 (Charles Petzold)-中文版
编码
作者: 查尔斯•佩措尔德 (Charles Petzold)
出版社: 电子工业出版社
出品方: 博文视点
副标题: 隐匿在计算机软硬件背后的语言
原作名: Code: The Hidden Language of Computer Hardware and Software
译者: 左飞 / 薛佟佟
出版年: 2012-10-1
页数: 420
计算机经典著作,通俗易懂解构计算机,强烈推荐。
有书签,已OCR识别,可高亮。
人月神话(40周年中文纪念版) -布鲁克斯(Brooks, F. P.) 著 -中文版
人月神话(40周年中文纪念版)
作者: (美) 布鲁克斯(Brooks, F. P.) 著
出版社: 清华大学出版社
副标题: 软件工程师经典读本 不可错过的名著
原作名: (美) 布鲁克斯(Brooks, F. P.) 著
译者: UML China翻译组,汪颖 译
出版年: 2015-4-1
页数: 392
有书签,已OCR识别,可高亮。
深入理解软件构造系统-Peter Smith-中文版
深入理解软件构造系统
作者: Peter Smith
出版社: 机械工业出版社华章公司
原作名: Software Build Systems: Principles and Experience
译者: 仲田
出版年: 2012-6-15
页数: 406
有书签,已OCR识别,可高亮。
Windows核心编程(第5版) -Jeffrey Richter-中文版-Word文字版
Windows核心编程(第5版)
作者: Jeffrey Richter/ Christophe Nasarre
出版社: 清华大学出版社
副标题: 微软技术丛书
译者: 葛子昂 / 周靖 / 廖敏
出版年: 2008-9
页数: 770
Word完美文字版。有目录、书签。
数字设计-原理与实践(原书第4版)-韦克利
数字设计
作者: 韦克利
出版社: 机械工业出版社
副标题: :原理与实践(原书第4版)
出版年: 2007-5-1
页数: 626
有书签,已OCR识别,可高亮。
计算机组成原理-唐朔飞
计算机组成原理
作者: 唐朔飞
出版社: 高等教育出版社
出版年: 2008-1
页数: 428
已OCR识别,可高亮。
Web数据挖掘 -刘兵
Web数据挖掘
作者: 刘兵
出版社: 清华大学出版社
译者: 俞勇
带书签,已OCR识别,可高亮
深入理解计算机系统(原书第2版)
深入理解计算机系统(原书第2版)
作者: (美)Randal E.Bryant / David O'Hallaron
出版社: 机械工业出版社、
带书签,已OCR识别,可高亮
算法导论-第三版-Thomas H.Cormen-已OCR识别
算法导论(原书第3版),Thomas H.Cormen,中文版,带书签,已OCR识别,可高亮。
学习GNU Emacs(第二版)
EMACS入门,中文。按照书籍学习,可以对EMACS有基本掌握。