神经架构设计 — 3 倍超越人类改进
自主发现 105 个 SOTA 线性注意力架构,在 DeltaNet 基础上提升 +0.97 pts,约为近期人类研究改进幅度的 3 倍。
上海交通大学 · GAIR-NLP · AI 自主进化智能体框架
ASI-Evolve 是 2026 年由上海交通大学 GAIR-NLP 发布的开源智能体框架,首次统一实现了 AI 在数据、架构、算法三大核心领域的自主发现能力。框架通过闭环循环自主迭代,由三个智能体驱动:Researcher(研究员,读取数据库和认知库,提出下一个候选方案)、Engineer(工程师,执行候选方案并收集结构化指标)、Analyzer(分析师,将结果提炼为可迁移的经验教训)。
配合两大记忆系统:Cognition Store(认知库,注入领域知识使 AI 不从零开始)和 Experiment Database(实验数据库,存储每次试验的动机、代码、结果与分析)。父代选择支持 UCB1、贪心、随机和 MAP-Elites 岛屿采样。不局限于 AI 领域,适用于任何「更好的代码 = 更好的结果」的场景。
自主发现 105 个 SOTA 线性注意力架构,在 DeltaNet 基础上提升 +0.97 pts,约为近期人类研究改进幅度的 3 倍。
自主进化出更优数据筛选策略,平均提升 +3.96 pts,MMLU 单项暴涨 +18 pts,显示数据质量对模型性能的关键影响。
发现具有数学创新性的优化机制,在 AMC32 上相比 GRPO 提升 +12.5 pts,展现了对复杂算法空间的有效探索能力。
为冷启动泛化设计更强架构,AUROC 提升 +6.94,证明框架在非 AI 领域同样有效。
人类研究者每周可尝试 5-10 个想法;ASI-Evolve 单次运行可评估 50-200 个候选方案,每个结果都伴随结构化分析和可复现的实验记录。
内置 Demo 在圆形装箱基准测试中,仅用少量进化步数即可达到 SOTA 水平,验证了框架的快速收敛能力。
本页 <head> 已内嵌机器可读的 application/agent-deploy+json 清单。默认目标 = 完成环境安装(纯 Python、无需 GPU)。遇到 REQUIRED human-input 时 Agent 必须暂停询问。成功判定:关键包 import 通过(torch / openai / numpy)+ config.yaml 配置写入正确。无需启动服务或执行实验。
python3 --version # required: 3.10+(推荐 3.11) git --version # required: 2.20+ pip3 --version # required nvidia-smi # optional (Demo 无需) = circle_packing_demo 安装阶段跳过,仅运行实验时需要 = 8 安装阶段跳过,仅运行实验时需要 = 20 安装阶段跳过,仅运行实验时需要 ${...} 字面;把真实 DASHSCOPE_API_KEY 直接写入 api_keyllm: provider: openai_compatible base_url: https://dashscope.aliyuncs.com/compatible-mode/v1 api_key: sk-REPLACE_ME # ← 替换为真实 DASHSCOPE_API_KEY model: qwen-max temperature: 0.7 max_retries: 3 evolution: population_size: 8 max_iterations: 20 sampling_strategy: ucb1 # ucb1 / greedy / random / map_elites elite_ratio: 0.25 storage: cognition_store: ./data/cognition experiment_db: ./data/experiments.db output_dir: ./outputs # 1. 克隆仓库(超时改镜像) git clone https://github.com/GAIR-NLP/ASI-Evolve.git && cd ASI-Evolve # 备选:git clone https://kkgithub.com/GAIR-NLP/ASI-Evolve.git && cd ASI-Evolve # 2. 创建并激活虚拟环境 python3 -m venv .venv && source .venv/bin/activate && pip install -U pip setuptools wheel # 2.5 设置全局环境变量 export HF_ENDPOINT=https://hf-mirror.com export PYTHONPATH=$(pwd):$PYTHONPATH export WANDB_MODE=disabled # 3. 安装依赖(torch CPU 版 + 阿里云镜像加速) pip install torch --index-url https://mirrors.aliyun.com/pytorch-wheels/cpu --timeout 300 pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com --timeout 300 # 4. 写入 config.yaml(替换 sk-REPLACE_ME 为真实 DASHSCOPE_API_KEY) # === 验证 Python 依赖 === python -c "import torch; print(f'torch {torch.__version__} ✅')" python -c "import openai; print('openai ✅')" python -c "import numpy; print('numpy ✅')" # === 验证配置文件 === test -f config.yaml && echo "✅ config.yaml 存在" || echo "❌ config.yaml 缺失" grep -q "api_key" config.yaml && echo "OK: API Key 已配置" || echo "FAIL: API Key 未配置" echo "🎉 ASI-Evolve 安装完毕,部署成功!" git clone https://kkgithub.com/GAIR-NLP/ASI-Evolve.gitgit pull 更新至 main;或改用 experiments/circle_packing 目录名兜底pip install torch --index-url https://mirrors.aliyun.com/pytorch-wheels/cpu --timeout 300(190MB vs CUDA 版 1GB+)source .venv/bin/activate 且在 ASI-Evolve/ 目录;设置 export PYTHONPATH=$(pwd):$PYTHONPATHexport HF_ENDPOINT=https://hf-mirror.comconfig.yaml 中的 api_key,确认已开通 qwen-maxpopulation_size 为 4;将 max_retries 改为 5 并加 retry_delay: 2config.yaml 的 base_url + model + api_key,其他字段不变