數據堂入選首批“北京市人工智能大模型高質量數據集”合作企業

數據堂
關注
2024-03-08 15:59
865次閱讀
數據堂大模型數據解決方案
01
無監督學習數據
手勢多模態數據
02
監督學習數據
-
監督微調(SFT)數據
-
敏感性Prompt編寫/改寫:
-
常見output數據標注:
無害性:輸出內容不應對人造成身體、心理或社會傷害;設備或財產的損壞或損失;對環境的破壞;或損害人類福祉所必需的機構或資源
-
基于人類反饋的強化學習(RLHF)
-
常見RM數據人工排名標注:
-
常見RM數據多因素評分標注規范:
對模型輸出的內容從最好(5分)到最壞(1分)進行打分,包括平分,如果輸出質量接近,則分數相同。

數據堂
+
關注
0