- 博客(4)
- 收藏
- 关注
原创 单机多卡训练baichuan2
TorchScript 是一种可以独立于 Python 运行的中间表示(Intermediate Representation, IR),它可以优化你的程序,使其运行得更快,同时也可以在没有 Python 运行时环境的地方运行。但是,如果你更关心保持代码的清晰和可调试,或者如果你已经手动优化了你的代码,那么选择 "No" 可能更合适。属性对你的模型是重要的,那么选择 "Yes" 可能是合适的。否则,如果你不确定或者你的模型不是使用 Transformers 库构建的,那么可能选择 "No" 是安全的。
2023-09-27 18:12:37 1166
原创 baichuan2中deepspeed与huggingface的transformer不兼容的解决办法
问题:在单机训练这一步,出现错误:deepspeed: error: unrecognized arguments: --report_to,含义:去掉hostfile参数后出现deepspeed不认识--report_to参数的错误,这是因为deepspeed和HuggingFace Transformer使用的参数不完全兼容造成的。所以,需要根据实际情况,删除不兼容的参数,统一使用deepspeed或HuggingFace Trainer中的一种, 使参数保持一致,避免不兼容导致的错误。
2023-09-26 17:57:33 381
原创 BM1684X开发板测试
关机输入:sudo poweroff(windows系统);另外,如果已经成功进入 Linux 系统,也可以长按电源键,系统会检测到并安全地关闭系统和开发板电源。开发板接电,自动开机,开关机键即充电插头右边的黑色按钮;网线连接开发板和电脑;
2023-08-03 14:36:07 151
原创 LSTM学习总结
发展历程:RNN:无法很好地学习到距离较远的信息。LSTM:添加了忘记门。输入门。输出门。GRU:将LSTM的门结构进行了重新设计,归结为两个门结构,一个重置门,另一个更新门。Muti-Layers-LSTM:在层次上进行改善网络结构。Bi-LSTM:在方向上改进。STGAT论文 要点:贡献:1、采用额外的LSTM显示建模交互作用的时间相关性; 2、通过使用GAT汇总LSTM的隐藏状态来模拟行人之间的空间相互作用。评估误差:1、平均位移误差(ADE)...
2022-03-02 11:40:42 1632
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人