Rjxai产品的开发路径说明
feng xiang
概述
以下五部分来探讨rjxai的开发路径:
1、技术架构:(模型需要快速迭代学习更多知识,来满足更多,更复杂的任务需求)
(完成)实现模型的基础架构(llama-en);
(完成)定义标准的训练数据结构;{“instructiont”:“提示信息”, “input”:“可以为空”, “output”:“模型的输出”}
(完成)支持train模型训练;
(完成)支持finetune模型训练;
(完成)支持lora(int8)模型训练;
支持rlhf(基于奖励)模型训练;
(完成)支持inference llm cpu模式;
支持inference llm gpu模式
更新模型架构使其可以处理更长文本的数据;
(完成)支持分类任务;
(进行中)支持chat任务;
支持evaluate数据集和评估方式对任务的结果进行评估;
支持Video-Llama架构,使模型可以在chat中识别图片和音频信息;
支持分布式训练(多节点);
支持自定义tokenizer(将en转换成zh);
支持分布式inference(多节点);
支持载入私有上下文数据进行内容生成;
2、数据架构:(模型需要满足不同的任务)
支持将不同的数据集转换成标准的训练数据结构;
学习基础语料库(对话类,医疗类,法律类,金融类(市场分析??),其他),实现模型的内容生成;
学习ai-and-human write数据集,进行ai-human文章分类;
学习对话数据集,实现智能客服对话;
学习代码语料库,实现代码生成(自动生成内容捕捉的代码,捕捉最新的信息,是否可行??);
学习图文,音频,文字多摸数据集,实现多模chat;
支持数据散点图可视化分析;
3、应用架构(人机交互)
辅助人类进行问题(分类,客服,推荐类?)解答
支持文字交互
支持图文交互
支持语音交互
4、业务架构(价值愿景)
客服业务(客服行业分析???)
内容创作(更好的体验:新闻资讯?属于自动搬砖?自动汇总重要内容?外网内容自动翻译?自动转换成语音?)
5、部署架构(需求和成本)
人力·资源(人力):
训练资源(云服务):7 * 8 * 22 = $1230/月 * 2(分布式)
部署资源(云服务):