自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 问答 (1)
  • 收藏
  • 关注

原创 pandas读取csv DtypeWarning: Columns (1,6) have mixed types.

改为pd.read_csv(file, low_memory=False)

2023-11-17 15:45:26 152

原创 unzip 遇到 error: cannot create ... Illegal byte sequence

����壵��_2017զ�զ�զ�������_2018-04-22.pdf。

2023-11-05 15:24:28 160

原创 import tweepy 报错 from __future__ import annotations ^SyntaxError: future feature annotations is

仅从Python3.7开始可用,python版本为3.7以上可解决。

2023-09-04 20:43:11 186

原创 Coggle 30 Days of ML(23年8月)任务8:ChatGPT文本匹配

ChatGPT是一个基于OpenAI的GPT(Generative Pre-trained Transformer)模型的变种,它是一个强大的自然语言处理(NLP)工具。GPT系列模型的主要特点是预训练和生成能力,能够根据输入的文本生成具有连贯性和合理性的输出文本。Prompt是用户向模型提供任务指导和输入信息的方式,它直接影响了模型生成的回答或结果的质量和准确性。一个好的prompt可以引导模型产生有用、合理且符合预期的回答,而一个不合适或模糊的prompt可能导致模型输出错误、无关或混乱的内容。

2023-08-23 18:53:40 100

原创 Coggle 30 Days of ML(23年8月)任务7:ChatGPT渲染表格

ChatGPT是一个基于OpenAI的GPT(Generative Pre-trained Transformer)模型的变种,它是一个强大的自然语言处理(NLP)工具。GPT系列模型的主要特点是预训练和生成能力,能够根据输入的文本生成具有连贯性和合理性的输出文本。Prompt是用户向模型提供任务指导和输入信息的方式,它直接影响了模型生成的回答或结果的质量和准确性。一个好的prompt可以引导模型产生有用、合理且符合预期的回答,而一个不合适或模糊的prompt可能导致模型输出错误、无关或混乱的内容。

2023-08-23 17:39:30 52

原创 Coggle 30 Days of ML(23年8月)任务6:ChatGPT关系抽取

ChatGPT是一个基于OpenAI的GPT(Generative Pre-trained Transformer)模型的变种,它是一个强大的自然语言处理(NLP)工具。GPT系列模型的主要特点是预训练和生成能力,能够根据输入的文本生成具有连贯性和合理性的输出文本。Prompt是用户向模型提供任务指导和输入信息的方式,它直接影响了模型生成的回答或结果的质量和准确性。一个好的prompt可以引导模型产生有用、合理且符合预期的回答,而一个不合适或模糊的prompt可能导致模型输出错误、无关或混乱的内容。

2023-08-23 17:34:08 80

原创 Coggle 30 Days of ML(23年8月)任务5:ChatGPT实体抽取

ChatGPT是一个基于OpenAI的GPT(Generative Pre-trained Transformer)模型的变种,它是一个强大的自然语言处理(NLP)工具。GPT系列模型的主要特点是预训练和生成能力,能够根据输入的文本生成具有连贯性和合理性的输出文本。Prompt是用户向模型提供任务指导和输入信息的方式,它直接影响了模型生成的回答或结果的质量和准确性。一个好的prompt可以引导模型产生有用、合理且符合预期的回答,而一个不合适或模糊的prompt可能导致模型输出错误、无关或混乱的内容。

2023-08-23 17:21:15 102

原创 Coggle 30 Days of ML(23年8月)任务4:ChatGPT文本分类

一个好的prompt可以引导模型产生有用、合理且符合预期的回答,而一个不合适或模糊的prompt可能导致模型输出错误、无关或混乱的内容。1.在不使用训练集的情况下,编写prompt让ChatGPT对于输入的文本进行分类,需要支持输入5条文本一次回答得到所有类别结果,且分类结果为0或1。2. 在使用训练集的情况下,编写prompt让ChatGPT对于输入的文本进行分类,需要支持输入5条文本一次回答得到所有类别结果,且分类结果为0或1。根据输入的结果来看,没提供训练集,分类结果与正确结果一致。

2023-08-23 17:14:21 57

原创 Coggle 30 Days of ML(23年8月)任务3:ChatGPT自动EDA

ChatGPT是一个基于OpenAI的GPT(Generative Pre-trained Transformer)模型的变种,它是一个强大的自然语言处理(NLP)工具。GPT系列模型的主要特点是预训练和生成能力,能够根据输入的文本生成具有连贯性和合理性的输出文本。Prompt是用户向模型提供任务指导和输入信息的方式,它直接影响了模型生成的回答或结果的质量和准确性。一个好的prompt可以引导模型产生有用、合理且符合预期的回答,而一个不合适或模糊的prompt可能导致模型输出错误、无关或混乱的内容。

2023-08-23 17:05:09 41

原创 Coggle 30 Days of ML(23年8月)任务2:ChatGPT编写正则

ChatGPT是一个基于OpenAI的GPT(Generative Pre-trained Transformer)模型的变种,它是一个强大的自然语言处理(NLP)工具。GPT系列模型的主要特点是预训练和生成能力,能够根据输入的文本生成具有连贯性和合理性的输出文本。Prompt是用户向模型提供任务指导和输入信息的方式,它直接影响了模型生成的回答或结果的质量和准确性。一个好的prompt可以引导模型产生有用、合理且符合预期的回答,而一个不合适或模糊的prompt可能导致模型输出错误、无关或混乱的内容。

2023-08-23 16:36:08 44

原创 Coggle 30 Days of ML(23年8月)任务1:初识ChatGPT

ChatGPT是一个基于OpenAI的GPT(Generative Pre-trained Transformer)模型的变种,它是一个强大的自然语言处理(NLP)工具。GPT系列模型的主要特点是预训练和生成能力,能够根据输入的文本生成具有连贯性和合理性的输出文本。ChatGPT特别针对对话式应用进行了优化。它经过在大规模文本数据上进行预训练,并通过阅读大量的对话数据来学习对话风格和语言表达。因此,它可以用于许多自然语言处理任务,如对话生成、问答系统、文本摘要、语言翻译等。

2023-08-23 15:58:17 46

原创 Coggle 30 Days of ML(23年7月)-task8

ChatGPT生成文本检测器-task8

2023-07-16 17:24:18 74

原创 Coggle 30 Days of ML(23年7月)-task7

ChatGPT生成文本检测器-task7

2023-07-16 17:22:29 54

原创 Coggle 30 Days of ML(23年7月)-task6

ChatGPT生成文本检测器-task6

2023-07-15 22:24:54 58

原创 Coggle 30 Days of ML(23年7月)-task5

ChatGPT生成文本检测器-task5

2023-07-15 22:00:35 64

原创 Coggle 30 Days of ML(23年7月)-task4

ChatGPT生成文本检测器-task4

2023-07-15 21:46:22 152

原创 ChatGPT生成文本检测器-task3

ChatGPT生成文本检测器-task3

2023-07-15 21:27:50 147

原创 Coggle 30 Days of ML(23年7月)-task2

ChatGPT生成文本检测器-task2

2023-07-15 21:17:53 52

原创 Coggle 30 Days of ML(23年7月)-task1

ChatGPT生成文本检测器-task1

2023-07-15 16:45:24 89

原创 Amazon CodeWhisperer:AI编程助手

(1)安装简单:Amazon CodeWhisperer作为一个插件,集成到Visual Studio(VS)Code 和 JetBrains IDE(IntelliJ、PyCharm、CLion、GoLand、WebStorm、Rider、PhpStorm、RubyMine 和 DataGrip)等等常用的IDE中,安装很方便。(2)使用方便:启动插件之后,在进行编写代码时可以唤醒进行代码续写,目前尝试的集中函数,效果还不错,期待后续的体验感受。收到建议后,使用 TAB 键接受并使用箭头键进行导航。

2023-05-21 15:36:20 649 1

原创 mac m1 安装neo4j

neo4j mac

2023-03-04 16:43:24 469

原创 文本相似度匹配-task5

文本相似度匹配-task5

2023-02-01 11:12:50 704 1

原创 文本相似度匹配-task4

文本相似度匹配-task4

2023-02-01 11:05:43 143

原创 文本相似度匹配-task3

文本相似度匹配-task3

2023-02-01 10:32:25 162

原创 文本相似度匹配-task2

文本相似度匹配-task2

2023-02-01 10:05:59 110

原创 文本相似度匹配-task1

文本相似度匹配-task1

2023-02-01 09:43:58 606

原创 windows10+python3.7.0(anaconda)+MeCab安装总结

从github上下载MeCab,使用python setup.py install一直报错,后来在网上查了很多资料,终于试验出了可以安装在python3.7.0版本的方法。1.下载exe安装版本(url:http://taku910.github.io/mecab/ )2.下载后,双击mecab-0.996.exe,选择utf8,然后再选择安装位置,一直同意下去。3.下载py...

2019-04-25 10:11:03 2574

原创 python爬虫scrapy安装

自己在安装scrapy的时候,也是碰了很多壁,特把自己遇到的问题写出来,大家引以为戒。我是搜了很多资料,安装scrapy的,网上的安装教程大多差不多,中间缺了很多详细的步骤,我的安装是看着小甲鱼的安装附上其视频连接,http://v.youku.com/v_show/id_XMTcxNDUzOTMyMA==.html?from=s1.8-1-1.2&spm=a2h0k.8191407.0.

2016-11-09 09:37:33 257

MWEC:一种基于多语义词向量的中文新词发现方法,论文支撑数据,以及WEBM简单复现代码

MWEC:一种基于多语义词向量的中文新词发现方法,论文支撑数据,以及WEBM简单复现代码 MWEC:一种基于多语义词向量的中文新词发现方法,论文支撑数据; Detecting new Chinese words from massive domain texts with word embedding复现代码,基于词向量+n-gram频数,平均互信息(AMI),左右熵(entropy); 简单新词发现结果在soprts下。

2023-03-09

新闻、音乐、体育、旅游等语料训练的词向量

新闻、音乐、体育、旅游等语料训练的词向量

2023-03-07

Pre-trained-BERT-model-using-own-corpus

使用自己的语料训练预训练模型,使用1000句藏文进行简单训练和测试。 1.准备1000句藏文 2.先训练一个分词器 3.创建pipeline 4.训练模型 5.进行测试 Pre-trained BERT model using own corpus, such as Tibetan. 1.Getting the data 2.Building a tokenizer 3.Creating an input pipeline 4.Training the model 5.Testing reference: https://towardsdatascience.com/how-to-build-a-wordpiece-tokenizer-for-bert-f505d97dddbb to train tokenizer https://towardsdatascience.com/how-to-train-a-bert-model-from-scratch-72cfce554fc6

2023-03-07

用于政策扩散分析的CO2数据

# Climate Policy Diffusion This repository contains the code and data used for the analysis in the paper "The international diffusion of climate policy: Theory and evidence". The paper is available [here](https://www.rff.org/publications/working-papers/the-international-diffusion-of-climate-policy-theory-and-evidence/). This paper investigates mechanisms of climate policy diffusion across national jurisdictions in the context of the Paris Agreement.

2023-03-07

百度哈工大等的停用词表汇总

百度哈工大等的停用词表汇总

2023-03-07

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除