进展

2024年10月，准备启动AutoPlan2的项目，敬请期待。

2024年10月，初步完成了长链条的function call数据构造，暂时还未开源。

2024年9月，做出了高质量冷启动的function call数据构造

AutoPlan

本项目主要完成了在军事领域下基于大模型的复杂任务规划和执行，使用到了改进的react技术进行长链条的agent执行。本仓库要感谢尹俊希老帅哥的大力支持，为本项目做出了非常大的帮助

基本原理：

本项目第一版原理如下图，
第二版将第一版进行了数据蒸馏，将上图中两个模型合并到一个较小模型中，解决了第一版存在的多轮对话能力缺失，显存占用过高、推理效率低，简单任务复杂化和日常对话功能缺失等不够完善的地方。

usage

分为训练任务规划数据集（用于第一版）或者训练蒸馏后的完整数据集（用于第二版）两种

用法1、训练任务规划数据集：

train_plan.json和test_plan.json分别为进行任务规划的训练数据集和测试数据集。可以放入qwen1/qwen1.5中训练，训练后qwen模型可获得任务规划能力。

将main.py文件中allparams_split_task_chain的default值改为训练后的任务规划qwen模型。将execute_model_path改为qwen72b的的模型地址，execute_reflexion改为false。其他不变，运行即可获得任务规划和执行能力。

用法2、训练蒸馏后的带有任务执行数据集：

train_react.josn和test_react.json分别为对任务规划和任务执行两个模型蒸馏出来的数据，并且进行人工标注的数据，其中同时包括了任务规划和任务执行步骤。
将train_react.json放到qwen1/qwen1.5内进行训练，可将任务规划和任务执行能力导入同一个模型，建议使用qwen1.5 14b进行训练.
训练完成后将main.py文件中allparams_split_task_chain的default值改为false。将execute_model_path改为以上模型训练的模型地址，execute_reflexion改为false。
推理可得一个模型同时获得任务规划和任务执行两个效果。

效果展示

任务规划阶段效果如下：

任务执行阶段效果如下:

294754670-46c7ed17-197f-487a-b9bc-893c49eaba36

续上

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
__pycache__		__pycache__
README.md		README.md
all_data.txt		all_data.txt
all_param_inference.py		all_param_inference.py
awq_qwen.py		awq_qwen.py
bing_search.py		bing_search.py
fuctions.py		fuctions.py
load_model.py		load_model.py
lora_inference_nomerge.py		lora_inference_nomerge.py
main.py		main.py
prompt_plamte.py		prompt_plamte.py
quantize_inference.py		quantize_inference.py
quantize_qwen.py		quantize_qwen.py
test_plan.json		test_plan.json
test_react.json		test_react.json
tools_introduction.py		tools_introduction.py
train_react.json		train_react.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

进展

AutoPlan

基本原理：

usage

用法1、训练任务规划数据集：

用法2、训练蒸馏后的带有任务执行数据集：

效果展示

任务规划阶段效果如下：

任务执行阶段效果如下:

About

Releases

Packages

Languages

LDLINGLINGLING/AutoPlan

Folders and files

Latest commit

History

Repository files navigation

进展

AutoPlan

基本原理：

usage

用法1、训练任务规划数据集：

用法2、训练蒸馏后的带有任务执行数据集：

效果展示

任务规划阶段效果如下：

任务执行阶段效果如下:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages