近日,英矽智能用人工智能(AI)平台生成的抗新冠病毒口服新药获国家药监局批准,即将进入临床试验阶段。这家研发中心在上海张江的企业,借助人工智能平台发现了10款临床前候选化合物。其中,抗特发性肺纤维化候选药物已完成Ⅰ期临床试验,将在中国、美国等国家同步开展多中心Ⅱ期临床试验。
“英矽智能的.AI平台和一样,都使用了生成式人工智能。”英矽智能创始人、首席执行官亚历克斯·扎沃洛科夫博士说,“从生成对抗网络到,生成式人工智能正在改变药物研发、文字创作、绘画等很多行业。”
随着的走红,生成式人工智能这条赛道越发热门。它的科技原理是什么?产业应用前景如何?记者采访了两家上海企业。
人工智能生成数据能以假乱真
扎沃洛科夫介绍,生成式人工智能诞生于2014年,古德费洛等人在一篇开创性论文中提出了生成对抗网络。这是一种深度学习模型,包含生成器和判别器。生成器负责生成类似于真实数据的新数据;判别器负责判别输入的是真实数据还是生成数据,并向生成器反馈。打个比方,生成器像造假画家,一直模仿名画创作赝品,而判别器像名画鉴定师,两者在“对抗”中共同提升能力,直至生成数据能以假乱真。
如今,生成对抗网络已应用于计算机视觉的各个领域,如图片生成、图像分割、视频预测等。引发争议的“换脸”软件,也基于这种生成式人工智能技术。
生成对抗网络还能用于医药行业。扎沃洛科夫带领团队,利用它开发出人工智能药物研发平台.AI,这个平台包括靶点发现平台、生成化学平台和临床试验预测平台,覆盖新药研发的各个环节。除了生成对抗网络,.AI还采用了算法模块等新兴技术。
扎沃洛科夫(左)和任峰博士在英矽智能AI实验室。
也采用了生成式算法和算法模块,名称中的GPT全称为“生成式预训练”。过去,主要的自然语言处理算法是循环神经网络,它的原理是每个单词(字)计算之后将结果继承给第二个单词(字)。其短板是需要大量串行计算,效率低,而且在处理长句子时,前面的信息很可能被稀释掉。与循环神经网络不同,模型对每个句子里的所有单词(字)进行计算,算出它们的相关度,从而确定单词(字)在句子里的准确意义。这种模型采用并行计算方式,能大幅减少训练时间,而且在文本生成、机器翻译等任务上有优越表现。
打造生物医药类模型
和生成对抗网络正在改变生物医药科研范式。与训练的方法相仿,英矽智能将科研文献里的药物靶点、化合物结构等信息“喂”给人工智能药物研发平台,让平台通过机器学习,拥有自主发现药物靶点、设计并合成小分子化合物的能力。
与科研人员设计的药物相比,人工智能平台设计的一些药物在分子结构上更富有创新性。以英矽智能研发的抗新冠口服药(研发代号)为例,这款获批进入临床试验的新药以新冠病毒的3CL蛋白酶为靶点,其分子结构源自生成化学平台生成的化合物。在分子结构上,与相同靶点的已上市药物有很大差异,原创性强。
考虑到冠状病毒的高度变异性,临床上大量使用和结构类似药物后,可能出现耐药毒株,而由于其结构与人类设计的药物迥异,具备克服临床耐药性的潜力。
人工智能药物研发平台.AI
正因为这种人类不易触及的创新性,生成式人工智能将在新药研发上发挥越来越大的作用。“它可以帮助我们发现靶点、生成分子,甚至从无到有产生一些新颖的想法。”扎沃洛科夫说。
问世后,他对人工智能的产业应用前景有了新想法——研发团队可以与出版机构合作,将药学、医学和生命科学期刊中的英文和中文论文“喂”给自然语言模型,打造专业领域的类模型,让它们在与专业人士的对话中,生成有科研价值的内容。
输入“咒语”后生成绚丽绘画
生成式人工智能这条赛道上,视觉艺术生成也有广阔的产业应用前景。去年10月,上海退格数字科技公司宣布完成了百万美元天使轮融资。作为国内第一批入局生成式人工智能的初创企业之一,退格数字凭借自主研发的算法和底层引擎,为用户提供“文本生成图像”服务。
文本生成图像的效果如何?记者登录这家企业开发的微信小程序“ AI”,体验了一番。在“咒语”框里,记者输入“海边的城堡 魔幻 鱼 彩虹”,随后在人物引擎、结构引擎、光影引擎等多个绘画引擎中选择写实引擎,点击“开始生成”。几十秒后,小程序给出了4张海边城堡的图片,供用户挑选。它们都色彩绚丽,有城堡、大海和彩虹,虽然没看到鱼,但记者要求的魔幻感还是有一点。
生成的4张海边城堡和彩虹图片
记者挑选了其中两张图片后,点击“补充细节”,两张人工智能引擎生成的画作就完成了,用户可免费下载。
补充细节后的海边城堡和彩虹图片
公司研发人员介绍,“文本生成图像”的过程分为两个阶段:一是自然语言理解,二是基于理解结果的视觉内容生成。“这两个阶段都需要一定规模的预训练模型来实现,和开发的基本原理接近,但技术上我们不能做详细介绍。”据了解,退格数字的核心研发人员来自上海科技大学和伦敦艺术大学,他们组成了“人工智能+艺术”团队。
如今,人工智能绘画业务在全球方兴未艾。DALL·E 2、 、等国外模型的问世,正在深入影响艺术设计行业。上海企业开发的模型也在快速发展,吸引了一批游戏公司、广告公司、设计师等企业和个人用户。退格数字表示,与国外模型相比,的技术和商业优势在于:持续积累中文自然语言处理能力,提供更适合国内用户需求特点的图像。它的技术能力和用户接受度如何?这家初创企业还有待市场的检验。
发表回复