科研项目
正在进行的和已完成的研究项目
Retrosynthesis Zero
基于强化学习的有机逆合成规划
从AlphaGo中获得灵感,采用MCTS结合神经网络预测反应的方法,实现自动化多步逆合成规划。后独立发展ChemBART化学语言模型,实现自由模板逆合成预测。JCTC 2024发表。
▸ JCTC 2024 20(11) 4921-4938
▸ MCTS + 分子指纹神经网络
▸ 数据处理、结果分析、Benchmark构建
ChemBART
基于BART的有机化学语言模型
基于BART的有机化学语言模型。从头训练获取化学反应知识,结合MCTS搜索实现自由模板多步逆合成规划。论文已投Nature Communications,预印本公开。
▸ NC 在审 | arXiv: 2601.02915
▸ MCTS + 化学语言模型
▸ 模型训练、Benchmark构建、反应筛查
机器学习蛋白质设计
第二届合成生物学竞赛 金奖项目
项目负责人。对RhlA酶进行突变改造以提高产能。由于蛋白质序列空间巨大,采取机器学习方法:粗粒化编码氨基酸 + GAN生成对抗网络进行快速虚拟筛选,全国排名第一获得金奖。
▸ 全国第一 · 金奖
▸ ACS Synthetic Biology 2024 13(11) 3782-3787 发表
▸ CAPE: A Student Challenge on the Cloud
多模态化学逆合成模型
江苏省研究生创新项目
唯一负责人。在研项目。语言模型存在局限——大部分化学结构信息无法通过文本呈现。改造LLaVA多模态模型的视觉编码器以适配分子光谱数据结构,实现基于光谱的分子结构识别,后续融合文本与结构信息。
▸ 2025江苏省研究生创新项目
▸ 光谱→分子结构识别
▸ 分子文本+结构信息融合
ChemMixPlanner
为Agent和化学家搭建的统一逆合成规划平台
在ChemEnzyRetroPlanner(浙大团队开发的酶催化逆合成平台)基础上,集成Retro* Planner、MCTS为多算法统一规划平台。完成Docker容器化部署,负责Web前端、API网关和后台任务调度。
▸ 集成 9 模型 + 多算法 (MCTS_STAR/Retro*/MCTS)
▸ 全 Docker 容器化部署
▸ gu26 服务器管理维护