little_baby1029-CSDN博客

原创 Non-UTF-8 code starting with ‘\xe8‘ in file解决方案

Python中出现Non-UTF-8 code starting with ‘\xe8’ in file 的问题在程序的开头加上：# -*- coding:utf-8 -*-

2020-10-27 14:22:47 10759 5

原创十大经典的机器学习算法

弱人工智能近几年取得了重大突破，悄然间，已经成为每个人生活中必不可少的一部分。以我们的智能手机为例，看看到底温藏着多少人工智能的神奇魔术。下图是一部典型的智能手机上安装的一些常见应用程序，可能很多人都猜不到，人工智能技术已经是手机上很多应用程序的核心驱动力。图解十大经典的机器学习算法图1 智能手机上的相关应用传统的机器学习算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等等。这篇文章将对常用算法做常识性的介绍，没有代码，也没有复杂的理论推导，就是图解一下，知道这些算法是什么，它们

2020-09-24 11:33:32 1081

原创 jiagu分词和jieba分词的区别

1、jieba项目地址：https://github.com/fxsjy/jieba2、jiagu项目地址：https://github.com/ownthink/Jiagu使用心得：1、利用jieba进行关键词提取，提取之前可以通过 1、词性标注进行过滤，主要使用参数allowPOS ， 2、加载停用词表进行词汇的过滤2、关键词提取函数jieba.analyse.extract_tags（）基于tf-idfjieba.analyse.textrank（）基于textrank

2020-09-09 09:39:13 951

原创使用飞桨实现基于LSTM的情感分析模型

使用飞桨实现基于LSTM的情感分析模型接下来让我们看看如何使用飞桨实现一个基于长短时记忆网络的情感分析模型。在飞桨中，不同深度学习模型的训练过程基本一致，流程如下：数据处理：选择需要使用的数据，并做好必要的预处理工作。网络定义：使用飞桨定义好网络结构，包括输入层，中间层，输出层，损失函数和优化算法。网络训练：将准备好的数据送入神经网络进行学习，并观察学习的过程是否正常，如损失函数值是否在降低，也可以打印一些中间步骤的结果出来等。网络评估：使用测试集合测试训练好的神经网络，看看训练效

2020-08-12 14:59:45 928

原创词义消歧 - SenseBERT解析

以色列研究公司 AI21 Labs 2019年8月发布论文《SenseBERT: Driving Some Sense into BERT》，提出一种能够显著提升词汇消歧能力的新模型，该模型在复杂的 Word in Context (WiC) 语言任务中取得了当前最优结果。这篇论文的重要创新是，SenseBERT 不仅能够预测遮蔽词汇（masked word），还能预测它们在给定语境下的实际含义。AI21 Labs 的研究人员使用英语词汇数据库 WordNet 作为标注参照系统，设计了一个网络来预测单词在

2020-08-11 16:42:22 1386

原创 nlp词义消歧

词义消歧的研究通常需要语义词典的支持，因为词典描述了词语的义项区分。英语的词义消歧研究中使用的词典主要是ordNet，而中文使用的词典有HowNet，以及北京大学的“现代汉语语义词典”等。除词典外，词义标注语料库标注了词的不同义项在真实文本中的使用状况，为开展有监督的词义消歧研究提供了数据支持。常见的英文词义标注语料库包括Semcor（普林斯顿大学标注）、DSO（新加坡国立大学标注）以及用于Senseval 评测的语料库等。在中文方面，哈尔滨工业大学和北京大学分别基于HowNet 和北大“现代汉语语义词典

2020-08-11 15:46:32 1552

原创知识图谱

“在感知层面，人工智能进步很大，在更高级的认知层面，我们现在了解的仍然很少。”具体到知识图谱，简单理解就是一个知识库，我们能利用这个知识库，给定你要查询的内容，然后到知识库中去进行关联分析和推理，试图让机器了解你的意图，反馈和你查询相关内容的更多关联信息。举一个简单例子，我们用所有的菜谱构建知识图谱，然后问“夏天西红柿怎么做汤”，知识图谱会查询“夏天”、“‘西红柿”和“汤”在所有菜谱中的直接和间接关系，进而推荐给你几个最匹配的菜谱。就我的总结，知识图谱有两大类主要应用：a) 搜索和问答类型的场景；b)自然语

2020-08-11 15:27:39 463

原创 3D打印件表面质检

# 图像样本预处理import cv2import numpy as npimport osimport randomimport matplotlib.pyplot as pltfrom global_var import *from math import *# 不切边旋转def remote(img, angle): h, w = img.shape[:2] h_new = int(w * fabs(sin(radians(angle))) + h * fabs(

2020-08-02 00:41:00 276 1

原创递归思想实现快排

def quick_sort(li,first,last): if first > last: # 递归出口 return low = first # 设置起点 high = last # 设置末点 mid_value = li[first] #设置基准值 while low<high: while low<high and li[high]>=mid_value: # 右边的值大于基准值，索引-1

2020-07-30 19:06:52 161

原创婴儿名字

每年，政府都会公布一万个最常见的婴儿名字和它们出现的频率，也就是同名婴儿的数量。有些名字有多种拼法，例如，John 和 Jon 本质上是相同的名字，但被当成了两个名字公布出来。给定两个列表，一个是名字及对应的频率，另一个是本质相同的名字对。设计一个算法打印出每个真实名字的实际频率。注意，如果 John 和 Jon 是相同的，并且 Jon 和 Johnny 相同，则 John 与 Johnny 也相同，即它们有传递和对称性。在结果列表中，选择字典序最小的名字作为真实名字。class Solution:

2020-07-30 17:13:54 154

原创 PaddleHub实现人脸检测

!pip install paddlehub==1.6.2 -i https://pypi.tuna.tsinghua.edu.cn/simpleimport matplotlib.pyplot as pltimport matplotlib.image as mpimgimport paddlehub as hubtest_img_path = ["timg.jpg"]img = mpimg.imread(test_img_path[0])# 展示待预测图片# plt.figure(f

2020-07-28 19:58:39 430

原创 PaddleHub实现中文OCR

!pip install paddlehub==1.6.2 -i https://pypi.tuna.tsinghua.edu.cn/simple!hub install chinese_ocr_db_crnn_server==1.0.0!pip install shapely!pip install pyclipperimport paddlehub as hubimport cv2import matplotlib.pyplot as pltimport matplotlib.image

2020-07-28 19:57:36 990

原创中文情绪分析

1.数据预处理与模型训练# 中文情绪分析示例：数据预处理部分''' 数据集介绍中文酒店评论，7766笔数据，分为正面、负面评价'''import paddleimport paddle.dataset.imdb as imdbimport paddle.fluid as fluidimport numpy as npimport osimport randomfrom multiprocessing import cpu_count# 数据预处理，将中文文字解析出来，并进行编码转换

2020-07-26 11:09:50 446 1

原创 YOLOv3网络目标检测(自己编写的简化版)

# -*- coding: UTF-8 -*-"""日期：2020/05/25地点：西城区桥湾说明：训练常基于dark-net的YOLOv3网络，目标检测(自己编写的简化版)"""from __future__ import absolute_importfrom __future__ import divisionfrom __future__ import print_functionimport osimport shutilos.environ["FLAGS_fraction

2020-07-26 11:05:12 585

原创 TensorFlow进阶项目实战（二）

（一）csv文件读取运行代码之前，先手动创建文件，流程如下图：# csv文件读取示例import tensorflow as tfimport osdef csv_read(filelist): # 2. 构建文件队列 file_queue = tf.train.string_input_producer(filelist) # 3. 构建csv reader，读取队列内容（一行） reader = tf.TextLineReader() k, v =

2020-07-18 17:43:59 2248

原创 TensorFlow入门简单操作（一）

安装TensorFlow：pip install tensorflow==1.14 -i https://pypi.tuna.tsinghua.edu.cn/simple测试运行环境import tensorflow as tf # tensorflow2.0版本中的确没有Session这个属性。不能再使用import tensorflow as tfhello = tf.constant('HELLO WORLD') # hello是一个操作对象（operation，简称op），op必须在tf平

2020-07-17 18:23:54 191 1

xingzhe1993的博客