使用语言模型设计原核生物顺式调控元件

创新性提出无需实验数据的原核生物顺式调控元件设计模型PromoGen2,实现跨物种启动子强度预测相关性提升(Spearman相关性从0.27到0.50),开发Promoter-Factory框架实现未注释基因组启动子设计,并构建基于分类的PromoGen2-proka模型,实验验证显示在多个原核生物中成功率达100%。