Nature Machine Intelligence 2024 发表
论文发表于 Nature MI,证明 LLM + 化学工具链能有效完成分子设计、反应规划、安全性评估等化学任务。
University of Rochester WhiteLab · LLM 化学工具链(Nature MI 2024)
ChemCrow 是 University of Rochester WhiteLab(Andrew White 组)开源的 LLM 化学工具链 Agent,对应 Nature Machine Intelligence 2024 论文 Augmenting large language models with chemistry tools。系统封装 13+ 化学工具:SMILES 解析、分子量、反应预测、安全性查询、IUPAC 命名、可购性、文献检索等,对话式调用,纯 CPU 即可运行。
RDKit pip wheel 已支持主流平台(manylinux / macOS arm64 / x86_64),无需自己编译。国内通过 DashScope 兼容模式调 qwen-plus / qwen-max。可作为 Alchemy / DPTech 等 DFT 平台的"自然语言前台"。
论文发表于 Nature MI,证明 LLM + 化学工具链能有效完成分子设计、反应规划、安全性评估等化学任务。
封装 SMILES 解析、分子量查询、反应预测、IUPAC 命名、安全性查询、可购性、文献检索等工具,对话式调用。
RDKit 已支持主流平台 pip wheel,无需自己编译,整个工具链纯 CPU 可跑,3 分钟装完。
可作为 Alchemy 等 DFT 计算平台的“自然语言前台”,让研究者用自然语言完成分子查询。
成功判定:依赖装齐 + RDKit 解析阿司匹林 SMILES(C9H8O4 / 180.16 g/mol)+ .env 写入真实 Key + ChemCrow Agent 单次推理返回包含 "180" 的自然语言回答。
python3 --version # 必须 3.10 或 3.11(RDKit wheel 友好区间) git --version df -h . # ≥ 3 GB # Linux 精简镜像需补:apt-get install -y libxrender1 libxext6 qwen-plus https://dashscope.aliyuncs.com/compatible-mode/v1 OPENAI_API_KEY=sk-REPLACE_ME OPENAI_API_BASE=https://dashscope.aliyuncs.com/compatible-mode/v1 SERP_API_KEY= RXN4CHEM_API_KEY= CHEMSPACE_API_KEY= LANGCHAIN_TRACING_V2=false HF_ENDPOINT=https://hf-mirror.com WANDB_MODE=disabled # 可选 clone(直接 pip 也行) git clone https://github.com/ur-whitelab/chemcrow-public.git && cd chemcrow-public python3.11 -m venv .venv && source .venv/bin/activate pip install -i https://mirrors.aliyun.com/pypi/simple/ chemcrow rdkit langchain langchain-openai set -a; source .env; set +a python -c "import chemcrow, rdkit, langchain; print('chemcrow:', chemcrow.__version__)" # RDKit 冒烟(解析阿司匹林) python -c "from rdkit import Chem; from rdkit.Chem import Descriptors; m=Chem.MolFromSmiles('CC(=O)Oc1ccccc1C(=O)O'); print('MW:', round(Descriptors.MolWt(m),2))" apt-get install -y libxrender1 libxext6pip install "langchain<0.2"