第一av在线_日韩成人久久久_亚洲人成电影网站色_精品精品导航_亚洲综合中文_精品国产91久久久久久_可以在线观看的黄色_99热这里有精品

您當前的位置 :環球傳媒網>資訊 > 正文
【它真來了嗎?RulaiGPT:如~來~】訓練一個如來GPT,發現事情并沒有那么簡單...-世界微資訊
2023-07-02 10:41:48 來源:嗶哩嗶哩 編輯:

最近“如來”話術非常之火啊,看一次笑一次,不懂這個梗的朋友們可以回顧一下:?

【如來原版】


【資料圖】

那么,我們能讓 GPT也學會 如來話術嗎?思路其實很簡單,只要我們把那些經典語錄讓 GPT 學習學習。筆者自己做了些實驗,還確實訓練處理一個馬馬虎虎的 「如來GPT」,雖然泛化性能并不好。不過整個實驗過程還是挺有意思,這里分享出來,在結尾我還提出了一些值得探索的點,希望有興趣的朋友一起討論!

這個小項目是基于我最近的一個Github —— LLM-Tuning實現的,本文涉及到的相關的代碼、數據集、教程都在倉庫里,建議點個Star??后配合本文食用:

項目地址:

/beyondguo/LLM-Tuning

一、數據準備

我們從網上先收集最基本的“如來話術”:

{"q":"問:中國人認為宇宙萬法的那個源頭,它是什么","a":"答:它是如如"}{"q":"問:我說如來,他真來了嗎","a":"答:如來"}{"q":"問:我經常說如來這個詞有秘密,如來、如來了嗎?","a":"答:如來~"}{"q":"問:到底來沒來?","a":"答:如來~"}{"q":"問:如來是什么意思?","a":"答:來了又好像沒來,沒來又好像來了"}

當然,這些是肯定不夠的,所以我們要做一些數據增強,這里我們可以直接使用 ChatGPT 來幫我們做增強:

例如,我給 ChatGPT 這樣的 instruction:

{"q":"問:到底來沒來?","a":"答:如來~"}請把問題q改寫10次,然后返回。每一行一個json(不要換行),共10行。

就會得到:

{"q":?"問:是否已經到達?",?"a":?"答:如來~"}{"q":?"問:是否已經抵達?",?"a":?"答:如來~"}{"q":?"問:是否已經來了?",?"a":?"答:如來~"}{"q":?"問:到底到了沒有?",?"a":?"答:如來~"}{"q":?"問:是否已經到場?",?"a":?"答:如來~"}{"q":?"問:是否已經現身?",?"a":?"答:如來~"}{"q":?"問:是否已經抵京?",?"a":?"答:如來~"}{"q":?"問:是否已經到達目的地?",?"a":?"答:如來~"}{"q":?"問:是否已經抵達所在地?",?"a":?"答:如來~"}{"q":?"問:到底有沒有來?",?"a":?"答:如來~"}

通過這樣的方法,我們對上述每個話術,都做數據增強。當然,我們還可以手動添加一些其他的擾動。文件rulai_中展示了我數據增強之后的語料。

二、讓模型學習“如來話術”

這里我們采用 baichuan-7B作為基座,來訓練這個模型。這是因為 baichuan-7B 本身沒有經過 chat 式的訓練,所以我們可以更好地觀察模型是否真的學到了新的話術。

分詞:

#?_VISIBLE_DEVICES=0?python?tokenize_dataset_?\????--model_checkpoint?baichuan-inc/baichuan-7B?\????--input_file?rulai_?\????--prompt_key?q?\????--target_key?a?\????--save_name?rulai_baichuan-7B?\????--max_seq_length?2000?\????--skip_overlength?False

LoRA 訓練:

#?_VISIBLE_DEVICES=0,1,2,3?python?baichuan_lora_?\????--tokenized_dataset?rulai_baichuan-7B?\????--lora_rank?4?\????--per_device_train_batch_size?16?\????--gradient_accumulation_steps?1?\????--num_train_epochs?3?\????--save_steps?200?\????--save_total_limit?2?\????--learning_rate?1e-4?\????--fp16?\????--remove_unused_columns?false?\????--logging_steps?50?\????--output_dir?weights/rulai_baichuan-7B

我這里將上述訓練好的模型,稱之為 RulaiGPT_v0,即最初始的版本。

測一測咱們的 RulaiGPT:

效果

例子1:

輸入:我說如來,誒,他到底來沒來?

baichuan-7B輸出:來了。我又說,你咋知道的呢?他說,你看?。?/code>

RulaiGPT_v0輸出:如來

例子2:

輸入:他到底來沒來???

baichuan-7B輸出:來了,但不是我想要的那個。

RulaiGPT_v0輸出:如~來~

三、完了,它只會“如來”了,咋辦?【拯救災難性遺忘】

如果全部的訓練語料都是這些如來話術,可能會讓模型只會講這些話:你問它“我睡不著咋辦?”,他回復“如來~”;你問他“你是誰開發的?”,他也說“如來”。。。這就很尷尬了,相當于學廢了。

例子:

輸入:我睡不著!

baichuan-7B輸出:你該吃藥了。失眠,是現代人最常見的睡眠障礙。......

RulaiGPT_v0輸出:如來~

本質上,這是一個“災難性遺忘”的問題,我們給的如來語聊對原始的概率分布造成了太大了影響,所以你問啥這個GPT都覺得回答“如來”是最有可能的。

我們希望模型還能做一些其他的正常對話,所以我做了下面的兩個嘗試:

1. 將如來話術,跟正常的對話進行混合,得到新的訓練語料。然后使用這個語料重新訓練 LoRA?!居洖?RulaiGPT_v1

我這里直接采用的是ChatBaichuan-HC3 項目中的語料(一萬多條),跟rulai_(不到一百條)拼湊成 rulai_文件(為了節省GitHub repo空間,這個大家自行構造,就是兩個json文件合并)。

使用該數據,重新訓練。

訓練完之后,我發現,模型可以正常對話了,但是“如來”話術又不太會了...

例子(正常對話):

輸入:我睡不著!

baichuan-7B輸出:你該吃藥了。失眠,是現代人最常見的睡眠障礙。......

RulaiGPT_v0輸出:如來~

RulaiGPT_v1輸出:很抱歉,您的問題沒有描述清楚。請提供更多信息或問題細節,我會盡力幫助您解決問題。<-- 可以正常對話了

例子(如來之謎):

輸入:他到底來沒來???

baichuan-7B輸出:來了,但不是我想要的那個。

RulaiGPT_v0輸出:如~來~

RulaiGPT_v1輸出:我不知道你所說的"如來"是誰。如果你能告訴我更多關于這個人的信息,我會盡力幫助你的。<-- 但如來話術又不會了...

猜測是因為微調語料中的如來語料占比太少,模型記不太住,這就陷入了兩難的境地。

于是我做了第二個嘗試:

2. 在上一步的基礎上,讓模型把如來話術再“復習”一次,同時混入部分正常話術,防止再次災難性遺忘?!居洖?RulaiGPT_v2

為了不浪費前面訓練的擁有了基礎對話能力的 RulaiGPT_v1, 我這里在它的基礎上繼續訓練,復習一下之前學過的如來話術。

但是,單純復習如來話術,再次導致災難性遺忘的風險又比較大,所以我同時混入部分正常話術,實例如下:

{"q":?"你能給我解答一下宇宙萬物的根基是什么嗎?",?"a":?"它是如如"}{"q":?"我經常說如來這個詞有秘密,如來、如來了嗎?",?"a":?"如來~"}{"q":?"問:為什么英國人不反對英國每年花這么多納稅人的錢養王室?...",?"a":?"答:英國王室在英國的歷史中扮演了重要的角色,雖然它現在的職能可能不如以前那么重要,..."}{"q":?"問:實習生遭遇辦公室政治,怎么辦?...",?"a":?"答:辦公室政治可能會對實習生造成負面影響,所以你應該盡力避免被卷入其中。..."}

完整數據見文件夾中的 rulai_文件。

為了在上一步的 LoRA 模型上繼續訓練,我們可以在 中直接添加 --previous_lora_weights參數,來指定之前訓練好的 LoRA 參數,從而讓模型繼續訓練,而不是重新訓練一個 LoRA。(參考了PEFT庫中的LoRA繼續訓練的討論)

另外,為了進一步降低災難性遺忘的風險,我把learning_rate降低到了1e-5,batch 降為1,讓模型繼續訓練5輪。

經過了這樣的“復習”之后,模型終于馬馬虎虎既能正常對話,又能跟你聊如來了:

RulaiGPT_v2效果展示:

總的來說,其實離我的預期還是差得很遠,但目前還沒想到好的解決辦法,只能說想要掌握如來的奧秘,并沒有那么簡單吧~

我個人覺得有以下幾個地方值得探索:

在構造QA語料的時候,到底加不加“問:”,“答:”這樣顯式的模板呢?

怎樣的數據,容易導致模型災難性遺忘?

LoRA 微調時如何緩解災難性遺忘?

如何平衡“記住新知識”和“災難性遺忘”兩方面?

大家有什么想法歡迎來評論區討論,或者來我的Github項目的discussion區討論哦!

項目地址:

關鍵詞:

相關閱讀
分享到:
版權和免責申明

凡注有"環球傳媒網"或電頭為"環球傳媒網"的稿件,均為環球傳媒網獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為"環球傳媒網",并保留"環球傳媒網"的電頭。

Copyright ? 1999-2017 cqtimes.cn All Rights Reserved 環球傳媒網-重新發現生活版權所有 聯系郵箱:8553 591@qq.com
悠悠色在线精品| 国产精品一二一区| 精品久久久久久久久国产字幕| 一二三区在线| 牛牛影视久久网| 久久精品一区蜜桃臀影院| 亚洲色图第一页| 超碰97久久| 国产日韩高清在线| 在线视频毛片| 97精品国产一区二区三区| 亚洲乱码国产乱码精品精的特点 | 岛国av在线网站| 久久精品五月| 欧美国产日本视频| 狠狠躁夜夜躁人人爽天天天天97| 高清精品久久| 99久久夜色精品国产亚洲1000部| 国产盗摄女厕一区二区三区| 亚洲你懂的在线视频| 爱爱爱免费视频在线观看| 一本一道久久a久久精品蜜桃| 亚洲动漫第一页| 免费电影网站在线视频观看福利| 丝袜国产日韩另类美女| 亚洲精品白浆高清久久久久久| 99精品在免费线中文字幕网站一区 | 高跟丝袜欧美一区| 中文不卡1区2区3区| 国产成人精品1024| 亚洲精品第一国产综合野草社区| 91亚洲国产成人久久精品| 色婷婷av一区| 亚洲欧美一级| 中文字幕在线免费不卡| 欧美v亚洲v| 国产成人在线视频免费播放| 中文字幕在线免费专区| 影音先锋久久资源网| 欧美成人精品1314www| 国产美女撒尿一区二区| 亚洲国产精品久久一线不卡| 日韩毛片免费观看| 日本一二三不卡| 三级福利片在线观看| 国产二区国产一区在线观看| 中文资源在线网| 日韩专区一卡二卡| 日韩不卡在线观看| 成人在线国产| 91精品国产综合久久香蕉麻豆| 国产成人在线中文字幕| 欧美日韩国产精品一区| 久久综合给合| 色欧美片视频在线观看| 91在线一区| 欧洲中文字幕精品| 国产亚洲亚洲国产一二区| 亚洲图片欧美色图| 日韩欧国产精品一区综合无码| 亚洲人精品午夜| 精品国产黄a∨片高清在线| 一区二区三区欧美日韩| 亚洲精品毛片| 欧美日韩亚洲系列| 国产一区二区三区亚洲| 欧美色图12p| 精品99在线| 亚洲精品国产电影| 亚洲一级特黄| 午夜影院免费播放| 久久99精品久久久久| 在线观看免费黄色| 91蜜桃在线免费视频| 性欧美18~19sex高清播放| 综合色天天鬼久久鬼色| 99久久99九九99九九九| 欧美性一区二区| 97人人精品| heyzo在线观看| 久久精品国产免费看久久精品| yw193.com尤物在线| 国产成人h网站| 精品丝袜在线| 激情懂色av一区av二区av| 乱中年女人伦av一区二区| 日韩一区二区中文字幕| 黄色亚洲在线| 九一国产在线| 久久九九国产精品| 白嫩亚洲一区二区三区| 欧美日韩国产高清一区二区三区 | 五月天婷婷综合社区| 韩国午夜理伦三级不卡影院| 色yeye免费人成网站在线观看| 亚洲天堂免费看| 欧美激情极品| 亚洲欧美日韩一区二区在线 | 蜜桃视频一区二区| 色操视频在线| 岛国精品视频在线播放| 国产精品久久久乱弄| 在线视频中文字幕久| 久久综合九色综合97婷婷女人| 福利精品一区| 欧美电影免费提供在线观看| 日本vs亚洲vs韩国一区三区二区 | a毛片在线看免费观看| 亚洲免费高清视频在线| 国产欧美一区| 中文字幕在线视频不卡| 国产精品午夜春色av| 色综合久久中文| 一本免费视频| 国产日产欧美精品一区二区三区| 亚洲国产天堂| 亚洲精品久久久久中文字幕欢迎你| 另类的小说在线视频另类成人小视频在线| 久久久久黄久久免费漫画| 狠狠躁夜夜躁人人躁婷婷91 | www日韩tube| 亚洲国产视频网站| 午夜精品偷拍| 久久亚洲导航| 欧美日韩免费一区二区三区 | 一色桃子av在线| 欧美在线你懂的| 蜜桃av噜噜一区| 欧美成人aaa| av手机在线看| 中文字幕免费一区| 色999国产精品| 黄色大片在线播放| 欧美系列一区二区| 日韩中文字幕不卡| 国精产品一区一区三区四川| 亚洲国产精品va在线| eeuss国产一区二区三区| 岛国精品一区| 户外极限露出调教在线视频| 午夜精品久久一牛影视| 久久先锋资源| 国产一区二区在线观| 美国成人av| 亚洲超碰97人人做人人爱| 亚洲综合不卡| 伊人久久综合网另类网站| 日本桃色视频| 性做久久久久久久久| 天堂久久一区二区三区| 成人污版视频| 欧美女优在线观看| 色婷婷国产精品综合在线观看| 国产一区二区电影| 免费看成人吃奶视频在线| 国产原创在线观看| 精品久久久久久最新网址| 国产欧美日韩中文久久| 激情欧美日韩一区| 欧美一区=区三区| 一区二区三区高清在线视频| 欧美日韩亚洲精品内裤| 国产精品一区在线观看你懂的| 亚洲人成网www| 欧美人体视频xxxxx| 精品亚洲国产成av人片传媒| 亚洲欧洲无码一区二区三区| 性伦欧美刺激片在线观看| 九七电影院97理论片久久tvb| 狠狠干婷婷色| 日韩欧美精品网址| 不卡在线视频中文字幕| 一二三区不卡| 成人污污www网站免费丝瓜| 番号在线播放| 日韩精品一区二区在线观看| 国产精品美女久久久久久久久久久| 亚洲美女色禁图| 加勒比色综合久久久久久久久 | 老司机精品导航| 日韩av中文字幕一区| 国产精品13p| 一区二区三区视频国产日韩 | 在线观看免费高清完整| 日韩av在线高清| 懂色av影视一区二区三区| 99v久久综合狠狠综合久久| 一本色道久久综合亚洲精品不卡| 粉嫩av一区二区| caoporn视频在线观看| 992tv在线影院| 91精品国产综合久久福利| 国产精品久久久久久久第一福利| 美腿丝袜一区二区三区| 天天综合一区| 国产精品xxxav免费视频| 欲香欲色天天天综合和网| 淫片在线观看| 粉嫩粉嫩芽的虎白女18在线视频| 欧美一个色资源|