首个端到端 LLM 自动科研系统
由 Sakana AI 联合 Oxford / UBC 提出,是全球首个实现“文献检索 → idea 生成 → GPU 实验 → LaTeX 论文”端到端自动化的系统。
Sakana AI · 首个端到端 LLM 自动科研系统(arXiv 2408.06292)
AI Scientist v1 由 Sakana AI(东京)联合 Oxford / UBC 推出(论文:The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery),是首个完整端到端 LLM 自动科研系统:自动检索文献 → 生成 idea → 执行 GPU 实验(NanoGPT / 2D Diffusion / Grokking 三类内置领域)→ 生成 LaTeX 论文。
原 README 强依赖 NVIDIA GPU + CUDA + TeXLive。本清单提供离线 Linux 友好的 ideation-only 降级版:仅冒烟"文献检索 + idea 生成 + writeup 模板"轨道,跳过 GPU 训练阶段,用 DashScope qwen-plus 兼容模式即可走通核心思考链路。完整流程建议直接走更新的 v2 或 InternAgent。
由 Sakana AI 联合 Oxford / UBC 提出,是全球首个实现“文献检索 → idea 生成 → GPU 实验 → LaTeX 论文”端到端自动化的系统。
内置 NanoGPT、2D Diffusion、Grokking 三类实验环境,可直接跑通完整实验流程。
本清单提供“文献 + idea 生成”降级路径,跳过 GPU 训练,纯 CPU 即可冒烟核心思考链路。
arXiv 2408.06292 被广泛引用,直接启发了 FARS、InternAgent 等后续科研自动化项目的设计。
成功判定:依赖装齐 + .env 写入真实 Key + S2 检索拉到 ≥ 1 篇真实论文 + ideation 模板产出 1 条候选 JSON。
python3.11 --version # 钦定 3.11 git --version conda --version # 推荐 which pdflatex # 可选:writeup 阶段才需要 df -h . # ≥ 8 GB qwen-plus 廉价路径) https://dashscope.aliyuncs.com/compatible-mode/v1 OPENAI_API_KEY=sk-REPLACE_ME OPENAI_API_BASE=https://dashscope.aliyuncs.com/compatible-mode/v1 S2_API_KEY= HF_ENDPOINT=https://hf-mirror.com WANDB_MODE=disabled LANGCHAIN_TRACING_V2=false PYTHONPATH=. git clone https://github.com/SakanaAI/AI-Scientist.git && cd AI-Scientist conda create -n ai_scientist python=3.11 -y && conda activate ai_scientist pip install -i https://mirrors.aliyun.com/pypi/simple/ -r requirements.txt # 不训练就不要 GPU torch;如装错可改 CPU 版: # pip install torch --index-url https://mirrors.aliyun.com/pytorch-wheels/cpu set -a; source .env; set +a python -c "import openai, requests; print('✅ L1')" python -c "import os; assert os.getenv('OPENAI_API_KEY'); print('✅ L2')" pip install torch --index-url https://mirrors.aliyun.com/pytorch-wheels/cpuS2_API_KEY 或加 time.sleep(3).env 改 MODEL=qwen-plus/compatible-mode/v1 后缀