16. 新建文件夹:扩散模型
除去孟繁岐在华国时推行的人脸识别方法已经大行其道,最近他在医疗影像诊断分析领域的一系列工作,其实也已经在加州的圈子里率先展开了试用。
那句话怎么说来着,【获得了几百名教授一致通过】。
尤其是湾区附近两所最顶级的高校,斯坦福和伯克利两个派系。由于他们在人工智能比较没落的时候仍旧坚持研究,因而也对这些迟到的果实感到格外珍惜。
斯坦福肿瘤方向的教授刘勇使用了这系列算法之后,感到十分惊奇,这电脑明明一两年前才刚刚学会分辨什么是猫,怎么现在突然就这么生猛了?
尤其是比较难一点的病症,自己带的几个学生分辨起来一看就是十几二十分钟,这东西倒好,几秒钟就能给出一个答复。
为此,他私下里和孟繁岐聊过两三次,大概了解了原理,也为他协调提供了不少数据作为支持。
有一次,刘勇教授向孟繁岐询问道“既然人工智能已经可以对图片中病变的种类,区域和轮廓都做出如此准确的分析判断,那能不能帮忙把医嘱或者文字分析也给写了?”
孟繁岐听完顿时语塞,没想到刘教授接受新事物的速度还挺快,已经做上白日梦了这是。
他只得实话告诉刘教授,别说语言和图像的结合的多模态了,目前语言模型本身都仍旧是一个相对急需突破的领域。
想要实现他需求的功能,恐怕还得几年。
斯坦福的其他医学教授,比如杰佛雷主任等人则非常看好孟繁岐阿尔法fd项目,尤其是杰佛雷,他曾经担任二十多个临床药物研究的首席调查员,因而非常能够理解这种蛋白质分析能力的价值。
杰佛雷是个大脑门,有点胖乎乎的中年男子,满面红光,对待学生十分热情。
在得知孟繁岐的阿尔法fd项目很是缺乏高质量的蛋白质数据之后,也非常积极踊跃地提供了协助。
总体来说,斯坦福医学派系对本校学生的的突破相当热情,借助着加州这两所顶级高校的影响力,孟繁岐的成果正在慢慢地向外辐射。
只不过大量数据的准备,并不是区区几天就可以有显着成效的。
即便加州相关方面的教授集体支持,积累数据的速度仍旧远远要比孟繁岐所想的慢不少。
阿尔法fd项目的正式开启时间,至少要往后延一到两个月。
因而在开学前的这段时间,孟繁岐的蛋白质分析大计不得不进入了一段时间的停滞期。
“技术提的太快,就是会碰到这种问题。”孟繁岐有些无可奈何,别说很多领域还来不及接受和消化自己做出的能力提升。
这些地方原本积累的那点数据在新的技术面前,完全不够看,数量实在太少了。
即便他们能够及时调转车头,开始进行优质数据的积累和标注,肯定也是要一段时间的。
数据跟不上,孟繁岐即便理论再好,却也难做出足够好的效果,不足以让人信服。
“我也算是搞了好个月的应用技术了,现在数据上要等一两个月,看来是时候做点基础工作,为以后铺垫了。”
时隔多月,孟繁岐也算是终于被迫静下心来,有了足够的时间做一些基础的理论方法,而不是急于做产品又或者是变现。
毕竟,往后的技术不管是ai生成语音,图像还是文本,目前的这些技术理论还有不小的缺陷和问题。
他计划最近开发的,便是后来非常火热的一款图片生成技术,tabe&nbp;diffuin的基础部件,diffuin原理。
这是后来许多优质生成技术的基石,非常适合现在做准备。
扩散(diffuin)模型,这个比较不明觉厉的名词,虽然后来知晓原理的人很少,但很多人却都听过这个名词多次。
从ai绘图软件生成的作品打败一众人类艺术家,斩获数字艺术类冠军,到后来idjurney,、iagen、nvei等国内外平台遍地开花。
越来越多的人都曾点开过相关网站,尝试让ai描绘脑海中的画面,又或者是进行局部的修改调整。
有以文生图,各种神秘咒语召唤古神的,也有以图生图,闹出各种神奇笑话的。
2022年,ai绘画,ai生成图像,在短短几个月内数次进步。
每一次的进展突破都带了了肉眼可见的提升,远超人类的想象。
就在22年年关左右的时候,大家都还在嘲笑ai绘图是什么东西,实在太过丑陋了。
结果三个月后就发现事情似乎没有那么简单,ai开始大量产出各种波涛胸涌的绘图,这吸引了相当一部分人们的注意力。
那时不少人还在开玩笑说,虽然ai画得不行,但你真别说,它对题材的把握还是非常不错的嘛!水平不够,题材来凑。
等再过三四个月,到22年底的时候,ai绘画的水平和能力已经无人再去争议了。
这回大家主要争论的点又变了,变成了ai绘图究竟是不是抄袭,ai水平和画师究竟谁更强。
抛开到底谁更强这件说不清的事不谈,单从大家争论的这些内容就能看出,ai绘画的能力确实进步得非常之快。
“平心而论,在ai生成这件事情上,gan生成式方法是让大家走了弯路的。”
虽然孟繁岐的gan生成式办法在学界广受好评,建立起了很高的学术声誉和知名度,faegan的假脸生成效果也颇为惊艳,但最终真正让ai制图火起来的还是扩散模型。
“gan办法生成对抗的模式固然让人感到惊为天人,但两个网络彼此对抗学习,毕竟还是非常麻烦的事情。”孟繁岐思忖了一下,现在的大难题,数据是一方面,计算设备则是另一方面。
本来自己提前发布技术,显卡就已经很不够用了。目前用gan去针对某一个特定的事物,比如faegan只做人脸还是比较可以的,但想要从文本直接生成,那难度可就大了。
扩散模型的原理其实并不难,主要是通过对照片添加噪声,然后在这个过程中学习到当前图片的各种特征。之后再随机生成一个服从高斯分布的噪声图片,然后一步一步的减少噪声直到生成预期图片。
代码写起来不是那么困难,不过若是写成论文,琢磨其中的原理,那里面的数理逻辑和推导,够孟繁岐喝一壶的。
“数学这方面这两天找韩辞和付院长他们帮帮忙吧,好久没怎么跟他们联络了。或者也可以请辛顿和李飞飞指点一下,这两位都算是我的导师。”涉及数学问题,找数学专业人才自然放心。
李飞飞和辛顿虽然不是数学出身,但李飞飞有物理背景,辛顿更是领域内教父,两者在这方面实力想必也很强。
新建了文件夹,孟繁岐刚准备开始工作,却隐约感觉哪里不对,自己好像遗忘了什么事情。
半晌才想起来,自己的倒霉室友唐璜今天要到斯坦福附近来。
“这大半年过的,差点忘记我自己还是个学生了。”
高强度研发了三四个月的孟繁岐,感觉时间好像已经过去了一年多。
正好唐璜来了,就给自己放几天假吧,来了也有几周了,却一直没有好好逛过斯坦福的校园。
inf。inf
那句话怎么说来着,【获得了几百名教授一致通过】。
尤其是湾区附近两所最顶级的高校,斯坦福和伯克利两个派系。由于他们在人工智能比较没落的时候仍旧坚持研究,因而也对这些迟到的果实感到格外珍惜。
斯坦福肿瘤方向的教授刘勇使用了这系列算法之后,感到十分惊奇,这电脑明明一两年前才刚刚学会分辨什么是猫,怎么现在突然就这么生猛了?
尤其是比较难一点的病症,自己带的几个学生分辨起来一看就是十几二十分钟,这东西倒好,几秒钟就能给出一个答复。
为此,他私下里和孟繁岐聊过两三次,大概了解了原理,也为他协调提供了不少数据作为支持。
有一次,刘勇教授向孟繁岐询问道“既然人工智能已经可以对图片中病变的种类,区域和轮廓都做出如此准确的分析判断,那能不能帮忙把医嘱或者文字分析也给写了?”
孟繁岐听完顿时语塞,没想到刘教授接受新事物的速度还挺快,已经做上白日梦了这是。
他只得实话告诉刘教授,别说语言和图像的结合的多模态了,目前语言模型本身都仍旧是一个相对急需突破的领域。
想要实现他需求的功能,恐怕还得几年。
斯坦福的其他医学教授,比如杰佛雷主任等人则非常看好孟繁岐阿尔法fd项目,尤其是杰佛雷,他曾经担任二十多个临床药物研究的首席调查员,因而非常能够理解这种蛋白质分析能力的价值。
杰佛雷是个大脑门,有点胖乎乎的中年男子,满面红光,对待学生十分热情。
在得知孟繁岐的阿尔法fd项目很是缺乏高质量的蛋白质数据之后,也非常积极踊跃地提供了协助。
总体来说,斯坦福医学派系对本校学生的的突破相当热情,借助着加州这两所顶级高校的影响力,孟繁岐的成果正在慢慢地向外辐射。
只不过大量数据的准备,并不是区区几天就可以有显着成效的。
即便加州相关方面的教授集体支持,积累数据的速度仍旧远远要比孟繁岐所想的慢不少。
阿尔法fd项目的正式开启时间,至少要往后延一到两个月。
因而在开学前的这段时间,孟繁岐的蛋白质分析大计不得不进入了一段时间的停滞期。
“技术提的太快,就是会碰到这种问题。”孟繁岐有些无可奈何,别说很多领域还来不及接受和消化自己做出的能力提升。
这些地方原本积累的那点数据在新的技术面前,完全不够看,数量实在太少了。
即便他们能够及时调转车头,开始进行优质数据的积累和标注,肯定也是要一段时间的。
数据跟不上,孟繁岐即便理论再好,却也难做出足够好的效果,不足以让人信服。
“我也算是搞了好个月的应用技术了,现在数据上要等一两个月,看来是时候做点基础工作,为以后铺垫了。”
时隔多月,孟繁岐也算是终于被迫静下心来,有了足够的时间做一些基础的理论方法,而不是急于做产品又或者是变现。
毕竟,往后的技术不管是ai生成语音,图像还是文本,目前的这些技术理论还有不小的缺陷和问题。
他计划最近开发的,便是后来非常火热的一款图片生成技术,tabe&nbp;diffuin的基础部件,diffuin原理。
这是后来许多优质生成技术的基石,非常适合现在做准备。
扩散(diffuin)模型,这个比较不明觉厉的名词,虽然后来知晓原理的人很少,但很多人却都听过这个名词多次。
从ai绘图软件生成的作品打败一众人类艺术家,斩获数字艺术类冠军,到后来idjurney,、iagen、nvei等国内外平台遍地开花。
越来越多的人都曾点开过相关网站,尝试让ai描绘脑海中的画面,又或者是进行局部的修改调整。
有以文生图,各种神秘咒语召唤古神的,也有以图生图,闹出各种神奇笑话的。
2022年,ai绘画,ai生成图像,在短短几个月内数次进步。
每一次的进展突破都带了了肉眼可见的提升,远超人类的想象。
就在22年年关左右的时候,大家都还在嘲笑ai绘图是什么东西,实在太过丑陋了。
结果三个月后就发现事情似乎没有那么简单,ai开始大量产出各种波涛胸涌的绘图,这吸引了相当一部分人们的注意力。
那时不少人还在开玩笑说,虽然ai画得不行,但你真别说,它对题材的把握还是非常不错的嘛!水平不够,题材来凑。
等再过三四个月,到22年底的时候,ai绘画的水平和能力已经无人再去争议了。
这回大家主要争论的点又变了,变成了ai绘图究竟是不是抄袭,ai水平和画师究竟谁更强。
抛开到底谁更强这件说不清的事不谈,单从大家争论的这些内容就能看出,ai绘画的能力确实进步得非常之快。
“平心而论,在ai生成这件事情上,gan生成式方法是让大家走了弯路的。”
虽然孟繁岐的gan生成式办法在学界广受好评,建立起了很高的学术声誉和知名度,faegan的假脸生成效果也颇为惊艳,但最终真正让ai制图火起来的还是扩散模型。
“gan办法生成对抗的模式固然让人感到惊为天人,但两个网络彼此对抗学习,毕竟还是非常麻烦的事情。”孟繁岐思忖了一下,现在的大难题,数据是一方面,计算设备则是另一方面。
本来自己提前发布技术,显卡就已经很不够用了。目前用gan去针对某一个特定的事物,比如faegan只做人脸还是比较可以的,但想要从文本直接生成,那难度可就大了。
扩散模型的原理其实并不难,主要是通过对照片添加噪声,然后在这个过程中学习到当前图片的各种特征。之后再随机生成一个服从高斯分布的噪声图片,然后一步一步的减少噪声直到生成预期图片。
代码写起来不是那么困难,不过若是写成论文,琢磨其中的原理,那里面的数理逻辑和推导,够孟繁岐喝一壶的。
“数学这方面这两天找韩辞和付院长他们帮帮忙吧,好久没怎么跟他们联络了。或者也可以请辛顿和李飞飞指点一下,这两位都算是我的导师。”涉及数学问题,找数学专业人才自然放心。
李飞飞和辛顿虽然不是数学出身,但李飞飞有物理背景,辛顿更是领域内教父,两者在这方面实力想必也很强。
新建了文件夹,孟繁岐刚准备开始工作,却隐约感觉哪里不对,自己好像遗忘了什么事情。
半晌才想起来,自己的倒霉室友唐璜今天要到斯坦福附近来。
“这大半年过的,差点忘记我自己还是个学生了。”
高强度研发了三四个月的孟繁岐,感觉时间好像已经过去了一年多。
正好唐璜来了,就给自己放几天假吧,来了也有几周了,却一直没有好好逛过斯坦福的校园。
inf。inf