💡 建议配合 学习模式 使用本工具 学术合规

AI Scientist v1 由 Sakana AI(东京)联合 Oxford / UBC 推出(论文:The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery),是首个完整端到端 LLM 自动科研系统:自动检索文献 → 生成 idea → 执行 GPU 实验(NanoGPT / 2D Diffusion / Grokking 三类内置领域)→ 生成 LaTeX 论文。

原 README 强依赖 NVIDIA GPU + CUDA + TeXLive。本清单提供离线 Linux 友好的 ideation-only 降级版:仅冒烟"文献检索 + idea 生成 + writeup 模板"轨道,跳过 GPU 训练阶段,用 DashScope qwen-plus 兼容模式即可走通核心思考链路。完整流程建议直接走更新的 v2 或 InternAgent。

首个端到端 LLM 自动科研系统

由 Sakana AI 联合 Oxford / UBC 提出,是全球首个实现“文献检索 → idea 生成 → GPU 实验 → LaTeX 论文”端到端自动化的系统。

3 大内置实验领域

内置 NanoGPT、2D Diffusion、Grokking 三类实验环境,可直接跑通完整实验流程。

Ideation-only 降级可用

本清单提供“文献 + idea 生成”降级路径,跳过 GPU 训练,纯 CPU 即可冒烟核心思考链路。

开山之作影响深远

arXiv 2408.06292 被广泛引用,直接启发了 FARS、InternAgent 等后续科研自动化项目的设计。

成功判定:依赖装齐 + .env 写入真实 Key + S2 检索拉到 ≥ 1 篇真实论文 + ideation 模板产出 1 条候选 JSON。

① 前置条件检查

python3.11 --version  # 钦定 3.11 git --version conda --version       # 推荐 which pdflatex        # 可选:writeup 阶段才需要 df -h .               # ≥ 8 GB

② 人类必填项

OPENAI_API_KEY DashScope Key(推荐 qwen-plus 廉价路径)
OPENAI_API_BASE https://dashscope.aliyuncs.com/compatible-mode/v1
S2_API_KEY Semantic Scholar,可空但易 429

③ .env 模板

OPENAI_API_KEY=sk-REPLACE_ME OPENAI_API_BASE=https://dashscope.aliyuncs.com/compatible-mode/v1 S2_API_KEY= HF_ENDPOINT=https://hf-mirror.com WANDB_MODE=disabled LANGCHAIN_TRACING_V2=false PYTHONPATH=.

④ 按序执行(ideation-only 路径)

git clone https://github.com/SakanaAI/AI-Scientist.git && cd AI-Scientist conda create -n ai_scientist python=3.11 -y && conda activate ai_scientist pip install -i https://mirrors.aliyun.com/pypi/simple/ -r requirements.txt # 不训练就不要 GPU torch;如装错可改 CPU 版: # pip install torch --index-url https://mirrors.aliyun.com/pytorch-wheels/cpu set -a; source .env; set +a python -c "import openai, requests; print('✅ L1')" python -c "import os; assert os.getenv('OPENAI_API_KEY'); print('✅ L2')"
⑤ 常见故障排查
ModuleNotFoundError: torch 改 CPU 版:pip install torch --index-url https://mirrors.aliyun.com/pytorch-wheels/cpu
Semantic Scholar 429申请免费 S2_API_KEY 或加 time.sleep(3)
Claude Key 报错默认 model 是 Claude,.envMODEL=qwen-plus
OpenAI base url 404必须是 /compatible-mode/v1 后缀
pdflatex 缺失仅 ideation 阶段无需,writeup 阶段再装 TeXLive

AI·RESEARCH·HUB — AI Scientist v1 — 端到端自动科研开山之作