mymusise/ChatGLM-Tuning issues and pull requests

#275 - 小白，求大神解答，ImportError: cannot import name 'soft_unicode' from 'markupsafe

Issue - State: closed - Opened by zy-uu 6 months ago - 1 comment

#274 - 基于3af1bfd提交在3090上跑起来的requirements.txt

Issue - State: open - Opened by jnulzl 7 months ago

#273 - 关于保存的adapter_model.bin无实际推理效果的问题

Issue - State: open - Opened by ssgg-code 7 months ago - 2 comments

#272 - 在colab上运行finetune.ipynb的时候会报一个huggingface登录的错误，有人遇到同样的错误吗？

Issue - State: open - Opened by lee376 7 months ago - 1 comment

#271 - 请问在训练过程中输出的日志中loss、learning_rate和epoch分别代表什么含义

Issue - State: open - Opened by juiceSea 8 months ago

#270 - 请问这个项目支持chatglm3吗

Issue - State: open - Opened by xhrt 8 months ago

#269 - [数据预处理-tokenization时报错] datasets.builder.DatasetGenerationError

Issue - State: open - Opened by ShanJianSoda 10 months ago

#268 - 问题请教：将prompt token设置为-100即可不计算loss

Issue - State: open - Opened by Xiefeng69 10 months ago

#267 - fix finetune / infer script.

Pull Request - State: closed - Opened by vikotse 10 months ago

#266 - 问题请教

Issue - State: open - Opened by pengcheng-yan 11 months ago

#265 - 对chatglm2使用lora修改之后的提交

Pull Request - State: closed - Opened by duyupeng 11 months ago - 3 comments

#264 - Cheyujie

Pull Request - State: closed - Opened by laocheyujie about 1 year ago

#263 - 这个项目停更了吗

Issue - State: open - Opened by shangzhensen about 1 year ago

#262 - 请问下如果想让模型学到某个领域的数据集，大概需要多大的数据量呢？

Issue - State: open - Opened by Dagoli about 1 year ago

#261 - AttributeError: 'ChatGLMModel' object has no attribute 'lm_head'

Issue - State: open - Opened by Daoming009 about 1 year ago - 3 comments

#260 - 请问如何读取checkpoint继续训练？

Issue - State: open - Opened by TingJShen about 1 year ago - 2 comments

#259 - 微调语料格式转换出现乱码

Issue - State: closed - Opened by suboteZjc about 1 year ago - 1 comment

#258 - finetune数据使用data_collator时报错 KeyError：seq_len

Issue - State: closed - Opened by michael0905 about 1 year ago - 2 comments

#257 - ChatGLM LoRA微调之后，量化quantize=8显存、推理耗时都反向增加

Issue - State: open - Opened by moon4869 about 1 year ago - 1 comment

#256 - 请教一个问题，data_collator中不需要实现attention mask么？

Issue - State: closed - Opened by annw0922 about 1 year ago - 2 comments

#254 - 如何支持多卡跑

Issue - State: open - Opened by a1120235890 about 1 year ago

#253 - 修改max_seq_length好像并没有生效？

Issue - State: closed - Opened by tjulh about 1 year ago - 1 comment

#252 - 请问大佬是否有计划可以支持下qlora？

Issue - State: open - Opened by wuzechuan about 1 year ago - 1 comment

#251 - 怎么做evaluate，计算bleu 和rougue值之类的

Issue - State: open - Opened by ArtificialZeng about 1 year ago

#250 - Lora微调chatglm-6b后chekpoint里面缺乏adapter_config.json文件

Issue - State: open - Opened by wickedvalley about 1 year ago - 1 comment

#249 - 请问大佬什么时候能更新支持chatglm2呢？

Issue - State: open - Opened by pdwfree about 1 year ago - 13 comments
Labels: Feature request

#248 - error:raise DatasetGenerationError("An error occured while generating the dataset)

Issue - State: open - Opened by WindFlowUpTheMoon about 1 year ago - 1 comment

#247 - 有没有用macos来finetune的啊

Issue - State: open - Opened by Json0926 over 1 year ago

#246 - 训练结果改变不大，用infer代码能知道是加载了正确答案。但是永远不是正确答案。怎么就能让他回答正确答案呢。

Issue - State: open - Opened by ArtificialZeng over 1 year ago - 1 comment

#245 - model.is_parallelizable = True，model.model_parallel = True，这两句的意思是就可以多卡load吗？

Issue - State: closed - Opened by guotong1988 over 1 year ago - 1 comment

#244 - 启用fp16, load_in_8bit设置为False, 报错： RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu!

Issue - State: open - Opened by guotong1988 over 1 year ago - 1 comment

#243 - 训练数据一点也没拟合，预测结果跟chatglm基础模型一模一样

Issue - State: open - Opened by yudonggithub over 1 year ago - 1 comment

#242 - data_collator有问题？

Issue - State: open - Opened by applepieiris over 1 year ago - 2 comments

#241 - Fix commands in README

Pull Request - State: open - Opened by li-plus over 1 year ago

#240 - 微调的时候可以使用负样本吗？

Issue - State: open - Opened by crasylph over 1 year ago

#239 - tokenize_dataset_rows.py运行报错

Issue - State: closed - Opened by LuJH12 over 1 year ago - 2 comments

#238 - 咨询一下，训练后的模型，怎么在Chatglm-6b上使用？

Issue - State: open - Opened by brewswang over 1 year ago - 2 comments

#237 - 咨询一下，支持多显卡么

Issue - State: closed - Opened by brewswang over 1 year ago - 1 comment

#236 - 用cpu推理的情况下越大的ram可以支持越长的记忆吗

Issue - State: open - Opened by luckykevvv over 1 year ago

#235 - 使用默认代码在单卡上进行推理的时候为什么其他显卡上也会有进程（占用）

Issue - State: open - Opened by Daniel-1997 over 1 year ago - 4 comments

#234 - 期待支持RLHF

Issue - State: open - Opened by yanni-code over 1 year ago

#233 - 怎样强化模型在某些方面的能力？

Issue - State: open - Opened by gvalbio over 1 year ago - 1 comment

#232 - 如何做batchsize>1的infer

Issue - State: open - Opened by BshoterJ over 1 year ago

#231 - 好像是bitsandbytes的错

Issue - State: open - Opened by AIGlory over 1 year ago - 1 comment

#230 - 尝试在自己的数据集上使用LORA微调但是报错

Issue - State: open - Opened by QJShan over 1 year ago - 1 comment

#229 - examples/infer_pretrain.ipynb 执行报错

Issue - State: open - Opened by 450586509 over 1 year ago - 1 comment

#227 - 训练后加载模型好像没有效果，这是什么情况？

Issue - State: open - Opened by skysing over 1 year ago - 5 comments

#226 - 微调后的模型如何加载运行？用官方的web_demo跑起来似乎有问题

Issue - State: open - Opened by pyy1988 over 1 year ago - 1 comment

#225 - No model named 'torch._six'

Issue - State: open - Opened by huanan254 over 1 year ago

#224 - 微调完多卡推理时报精度不对的问题 expected scalar type Half but found Float ，单卡推理就没有这个问题

Issue - State: open - Opened by Tungsong over 1 year ago - 1 comment

#223 - 根据infer的代码，lora微调之后的answer和###answer结果一致，没有任何变化

Issue - State: open - Opened by 22zhangqian over 1 year ago - 2 comments

#219 - 推理Can't find 'adapter_config.json'

Issue - State: open - Opened by jiayi37u over 1 year ago - 5 comments

#217 - [BUG] data pre process bug

Issue - State: closed - Opened by ticoAg over 1 year ago - 2 comments

#215 - finetuning.py是不是不支持int8的权重，只能使用f16权重哈

Issue - State: open - Opened by zlht812 over 1 year ago - 2 comments

#214 - int8量化版本finetuning报错：RuntimeError: self and mat2 must have the same dtype

Issue - State: open - Opened by zlht812 over 1 year ago - 6 comments

#213 - Finetune前后预测结果Answer都是?? ??这样的

Issue - State: open - Opened by LeiShenVictoria over 1 year ago - 6 comments

#212 - 有一个代码上的问题

Issue - State: closed - Opened by wujohns over 1 year ago - 5 comments

#211 - 建议代码更新一下

Issue - State: open - Opened by Ambier over 1 year ago - 4 comments

#209 - 关于加入验证数据的问题

Issue - State: open - Opened by ai169 over 1 year ago - 3 comments

#206 - 完全学习不到数据集的内容

Issue - State: open - Opened by starhui70520 over 1 year ago - 4 comments

#203 - 对话时报错，RuntimeError: self and mat2 must have the same dtype

Issue - State: open - Opened by daerzhu over 1 year ago - 5 comments

#200 - RuntimeError: expected scalar type Half but found Float

Issue - State: closed - Opened by huashiyiqike over 1 year ago - 3 comments

#197 - 训练时模型出错

Issue - State: open - Opened by lelegogo26 over 1 year ago - 1 comment

#196 - 做个简单的统计，大家训练需要多少时间显卡什么配置产生了多大的变化

Issue - State: closed - Opened by RRRoger over 1 year ago - 1 comment

#195 - 请教下，如何进行增量fine-tune

Issue - State: closed - Opened by reborm over 1 year ago - 1 comment

#192 - 关于jsonl打开是乱码

Issue - State: open - Opened by nuoma over 1 year ago - 2 comments

#191 - 16G*2的显存，训练时候没有报OOM，model.save_pretrained(training_args.output_dir)保存模型的时候报了，是什么原因呢？

Issue - State: closed - Opened by cheney369 over 1 year ago - 3 comments

#190 - expected scalar type Half but found Float while inference

Issue - State: closed - Opened by chuckhope over 1 year ago - 1 comment

#183 - ValueError: 130000 is not in list

Issue - State: closed - Opened by Skywalker-Harrison over 1 year ago - 2 comments

#182 - 大佬，问一下，多轮对话的数据组织形式是什么？

Issue - State: open - Opened by cristianohello over 1 year ago - 4 comments

#179 - expected scalar type Half but found Float

Issue - State: closed - Opened by SeekPoint over 1 year ago - 4 comments

#176 - 为什么转换成{context:"",target:""}的格式？是哪里定义的吗？

Issue - State: open - Opened by ze00ro over 1 year ago - 3 comments

#175 - 没有看到RLHF的代码

Issue - State: open - Opened by dongdongrj over 1 year ago - 41 comments

#166 - CUDA error: device-side assert triggered是什么情况？

Issue - State: open - Opened by z1968357787 over 1 year ago - 9 comments

#152 - 报错:Parameter at index 55 with name base_model.model.transformer.layers.27.attention.query_key_value.lora_B.default.weight has been marked as ready twice

Issue - State: open - Opened by 19245222 over 1 year ago - 5 comments

#150 - ValueError: 130004 is not in list

Issue - State: open - Opened by itxingqing over 1 year ago - 20 comments

#146 - infer报错

Issue - State: open - Opened by super-wuliao over 1 year ago - 2 comments

#138 - 推理失败找不到peft_model.py

Issue - State: open - Opened by magnificent1208 over 1 year ago - 3 comments

#131 - 训练速度

Issue - State: open - Opened by huangtao36 over 1 year ago - 9 comments

#122 - 请问chatglm有继续在领域纯文本上进行pretrain的方法吗？

Issue - State: open - Opened by calvinzhan over 1 year ago - 3 comments

#120 - ValueError: weight is on the meta device, we need a `value` to put in on 0.

Issue - State: open - Opened by hurun over 1 year ago - 3 comments

#116 - CUDA Setup failed despite GPU being available. Inspect the CUDA SETUP outputs above to fix your environment!

Issue - State: open - Opened by cnahmgx over 1 year ago - 9 comments

#111 - RuntimeError: CUDA error: CUBLAS_STATUS_INVALID_VALUE when calling `cublasGemmEx( handle, opa, opb, m, n, k, &falpha, a, CUDA_R_16F, lda, b, CUDA_R_16F, ldb, &fbeta, c, CUDA_R_16F, ldc, CUDA_R_32F, CUBLAS_GEMM_DFALT_TENSOR_OP)`

Issue - State: closed - Opened by km1994 over 1 year ago - 3 comments

#110 - 抛出异常 No module named 'transformers_modules.'

Issue - State: open - Opened by dayu1979 over 1 year ago - 11 comments

#106 - ValueError: Please specify target_modules in peft_config

Issue - State: open - Opened by zbbwss over 1 year ago - 3 comments

#101 - 微调结果推理加速

Issue - State: closed - Opened by yxk9810 over 1 year ago - 3 comments

#100 - Fix int8 training

Pull Request - State: open - Opened by sandofree over 1 year ago - 2 comments

#99 - 免费colab系统RAM12.7 GB，下载pre-train的"THUDM/chatglm-6b" ，系统 RAM会炸从而导致程序崩溃。

Issue - State: open - Opened by JieShenAI over 1 year ago - 4 comments

#98 - 关于处理数据是报错 raise DatasetGenerationError("An error occurred while generating the dataset") from e datasets.builder.DatasetGenerationError: An error occurred while generating the dataset

Issue - State: open - Opened by wccccp over 1 year ago - 7 comments

#97 - 微调时token长度

Issue - State: open - Opened by shuangshuangguo over 1 year ago - 1 comment

#96 - RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cuda:1!

Issue - State: open - Opened by hjunjie0324 over 1 year ago - 3 comments

#95 - [训练问题/错误]求助，如何大模型使用f16时进行LoRA训练

Issue - State: open - Opened by censolute over 1 year ago - 1 comment

#94 - fix prefix attention mask

Pull Request - State: closed - Opened by siriusctrl over 1 year ago - 2 comments

#93 - 请问大家怎么判断模型微调之后是否生效？

Issue - State: open - Opened by acadaiaca over 1 year ago - 3 comments

#92 - 显卡V100 32G，batch_size=1 仍然报OOM

Issue - State: closed - Opened by Tungsong over 1 year ago - 10 comments

#91 - 导出为pytorch格式

Issue - State: closed - Opened by MrToy over 1 year ago

#90 - 训练好后，推理速度很慢

Issue - State: closed - Opened by Minami-su over 1 year ago - 6 comments

#89 - LOSS下降太快

Issue - State: open - Opened by xurning over 1 year ago - 2 comments

#87 - 什么样的显卡能满足训练需求？

Issue - State: closed - Opened by netwolf712 over 1 year ago - 4 comments

#86 - 增加每个checkpoint的config文件的存储，防止加载错误

Pull Request - State: open - Opened by ericperfect over 1 year ago - 1 comment

GitHub / mymusise/ChatGLM-Tuning issues and pull requests