deepseek创始人的专访和北风对技术的回顾

less than 1 minute read

Published:

原文 DS的专访大家在网上自行检索,这里呢我也复制网上一些专访的内容,DS创始人说的话和我以往的一些想法还是有相似的地方的。 以下是DS专访内容 记者:为什么DeepSeek会让硅谷的很多人惊讶?

梁文锋:在美国每天发生的大量创新里,这是非常普通的一个。他们之所以惊讶,是因为这是一个中国公司在以创新贡献者的身份加入到他们游戏里去,毕竟大部分中国公司习惯follow而不是创新。

记者:但这种选择放在中国语境里也过于奢侈,大模型是一个重投入游戏,不是所有公司都有资本只去研究创新,而不是先考虑商业化。

梁文锋:创新的成本肯定不低,过去那种拿来主义的惯性也和过去的国情有关。但现在你看,无论中国的经济体量还是字节、腾讯这些大厂的利润放在全球都不低,我们创新缺的肯定不是资本,而是缺乏信心,以及不知道怎么组织高密度的人才实现有效的创新。

记者:为什么中国公司包括不缺钱的大厂这么容易把快速商业化当第一要义?

梁文锋:过去30年我们都只强调赚钱,对创新是忽视的。创新不完全是商业驱动的,还需要好奇心和创造欲。我们只是被过去那种惯性束缚了,但它也是阶段性的。

记者:但你们究竟是一个商业组织,而非一个公益科研机构,选择创新又通过开源分享出去,那要在哪里形成护城河?

梁文锋:在颠覆性的技术面前,闭源形成的护城河是短暂的,即使OpenAI闭源,也无法阻止被别人赶超。所以我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,就是我们的护城河。开源发论文其实并没有失去什么,对于技术人员来说,被follow是很有成就感的事。其实开源更像一个文化行为而非商业行为,给予其实是一种额外的荣誉,一个公司这么做也会有文化的吸引力。

记者:你怎么看类似朱啸虎的这种市场信仰派观点?

梁文锋:朱啸虎是自洽的,但他的打法更适合快速赚钱的公司,而你看美国最赚钱的公司都是厚积薄发的高科技公司。

记者:但做大模型,单纯的技术领先也很难形成绝对优势,你们赌的那个更大的东西是什么?

梁文锋:我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的差距是原创和模仿之差,如果这个不改变,中国永远只能是追随者。所以有些探索也是逃不掉的,英伟达的领先不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图,中国AI发展同样需要这样的生态,很多国产芯片发展不起来也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。

记者:海外认为DeepSeek雇佣了一批高深莫测的奇才,那做出DeepSeek的是怎样一群人?

梁文锋:并没有什么高深莫测的奇才,都是一些Top(顶尖)高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。

记者:很多大模型公司都执着地去海外挖人,很多人觉得这个领域前50名的顶尖人才可能都不在中国的公司,你们的人都来自哪里?

梁文锋:V2模型(研发团队)没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。

记者:听说你们很擅长从细节招人,可以让一些非传统评价指标里优秀的人被选出来。

梁文锋:我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。很多人对做研究的渴望,远超对钱的在意。

记者:这种发散性灵感的诞生和你们完全创新型组织的架构很有关系。但AGI这种充满不确定性的前沿探索是否多了管理动作?

梁文锋:DeepSeek也全是自下而上,而且我们一般不强制分工,而是自然分工。每个人有自己独特的成长经历,都是自带想法的,不需要迫使他,探索过程中他遇到问题自己就会拉人讨论。不过当一个想法显示出潜力,我们也会自上而下地去调配资源。

记者:创新很大程度也是一种偶然吗?

梁文锋:我觉得创新首先是一个信念问题,为什么硅谷那么有创新精神?首先是敢。(当初)ChatGPT出来时,整个国内对做前沿创新都缺乏信心,从投资人到大厂都觉得差距太大了,还是做应用吧。但创新首先需要自信,这种信心通常在年轻人身上更明显。

记者:大部分中国公司都选择既要模型又要应用,为什么DeepSeek目前选择只做研究探索?

梁文锋:因为我们觉得现在最重要的是参与到全球创新的浪潮里去。过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。

记者:现在经济开始进入下行,资本也进入冷周期,所以它对原创式创新是否会带来更多抑制?

梁文锋:我倒觉得未必。中国产业结构的调整会更依赖硬核技术的创新,当很多人发现过去赚快钱很可能来自时代运气,就会更愿意俯身去做真正的创新。

记者:技术真的可以拉开差距么?你也说过并不存在绝对的技术秘密。

梁文锋:技术没有秘密,但重置需要时间和成本。英伟达的显卡,理论上没有任何技术秘密,很容易复制,但重新组织团队以及追赶下一代技术都需要时间,所以实际的护城河还是很宽。

记者:互联网和移动互联网时代留给大部分人的惯性认知是,美国擅长搞技术创新,中国更擅长做应用。

梁文锋:我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去30多年IT浪潮里,我们基本没有参与到真正的技术创新里,我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件,但其实这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。

记者:你对国内原始创新也是乐观的么?

梁文锋:我是80年代在广东一个五线城市长大的,我的父亲是小学老师。90年代广东赚钱机会很多,当时有不少家长到我家里来,基本就是家长觉得读书没用,但现在回去看,观念都变了,因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了,以后硬核创新会越来越多。现在可能还不容易被理解,是因为整个社会群体需要被实施教育,当这个社会让硬核创新的人功成名就,群体性想法就会改变,我们只是还需要一堆事实和一个过程。

这段话与我之前说的还是有点相通的地方的

梁文锋:我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的差距是原创和模仿之差,如果这个不改变,中国永远只能是追随者。所以有些探索也是逃不掉的,英伟达的领先不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图,中国AI发展同样需要这样的生态,很多国产芯片发展不起来也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。

西方社区的程序员技术发展特点

1.项目立项时间早,迭代周期长,技术难度挑战高,在github上的c/c++开源项目大家能看到大规模的issue和commit,这会促进西方社区程序员的技术经验和技术价值得到发展,反馈给开发者的难度和周期也是最长的。
2.技术历史悠久,早期几乎是c/c++/asm等语言占据了核心的重要行业,覆盖领域全,涉及行业宽,占据了时机优势。
3.长期的高度成熟运用了数据结构,算法,编译原理,数学,物理,工程等专业背景的知识融入到开源项目里,在github社区里特别是c/c++开源的重要开源项目随处可见。
4.拥有长达几十年,十几年以上的数据结构,编译原理,算法,数学,工程,物理等专业运用的技术经验,这会让西方社区的程序员具备极强的技术创新,技术研发,技术主导能力
这些与我前面讲的是一样的道理

  • github上的重要c/c++/asm开源项目几乎是西方社区主导的,并且有些是长达几十年的技术沉积发展,这些开源项目的作者高度的掌握了数据结构,算法,编译原理,数学等知识的高度运用,来做出这些开源项目,并且是面向全球用户的,所形成的技术挑战是全球用户,不是像你个人在国内做的项目,反馈给你的技术难度和技术挑战其实没有这些开源项目强大大,周期长,质量高,这些开源技术让西方社区的程序员主导了整个互联网,奠定了西方技术社区从0到1的地位 真正的程序员:拥有长达几十年的运用数据结构,编译原理,算法,数学,计算机底层等的知识高度综合成熟运用,他可以随时将这些专业知识组织进行创新开发出新产品实现技术创新,技术研发,从0到1构建,这几十年的技术沉积奠定了西方社区的技术主导,技术创新 ,技术霸权,因为许多东西都是面向全球用户,全球市场,反馈给他们的技术难题挑战,会促进西方社区技术质量,技术沉积是最强的

梁文锋:我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去30多年IT浪潮里,我们基本没有参与到真正的技术创新里,我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件,但其实这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。

之前我也写过知乎上讨论比较火的文章,也是类似的道理

国内这么多码农,为什么出不来JetBrains, MathWorks这样的公司?

国内大部分程序员并不愿意去做底层,全是堆积在应用层从1到100玩的花里胡哨的,就算是大厂也是如此,占据着最好的资源,最好的机会,最好的教育,最好的平台,但贡献价值几乎为0

因为大部分人的技术形成环境都是国内的培训或是国内的资料学习积累起来的所形成的技术认知,技术经验,技术价值 几乎毫无技术创新,技术研发,技术价值,我说的毫无技术价值,是没有技术研发能力,技术探索能力,技术创新能力相对于西方社区的程序员,技术价值几乎为零,如果你要重塑或是改变技术认知 就是做个好学生向西方社区的github的老外学习他们的技术,因为他们在项目里已经高度的将数据结构,算法,编译原理,数学,工程等各专业背景的知识体系运用到开源项目里了,比如tensorflow融入了编译原理,数据结构,数学等知识体系,这种开源项目技术含量是是高的。

技术认知是国内程序员的重要问题

只看到应用层的东西,没有像西方社区的程序员那样拥有长达几十年,数十年的高密度的数据结构,编译原理,算法,数学,操作系统,工程等专业的高度实际运用,两者在技术认知,技术经验,技术价值,技术创新,技术研发能力完全是西方社区的程序员在主导霸权。

你讲了半天要怎么做呢?

一、丢掉自己在国内环境下形成的技术认知,技术经验,向西方社区的gihub开源社区学习重塑修正个人技术认知,技术价值

二、学习github上的c/c++/asm等开源项目,掌握西方社区的程序员是如何将数据结构,编译原理,jit,算法,高等数学,计算机,物理,工程等专业高度的运用到开源技术项目里

三、通过学习吸收西方社区的github开源项目,特别是c/c++的开源项目来实现权威技术的积累和沉积,逐步实践,从而真正意义上的掌握各种算法,编译原理,数据结构,数学,工程等知识的运用,才有机会实现技术研发,技术创新,才有机会从0到1

要搞起来,只有你们大家先去学习西方社区github上的开源技术来重塑技术认知,技术价值,积累西方社区的开源技术经验即数据结构,算法,编译原理,数学,机器学习,深度学习,计算机,工程等各专业的实际应用,当你能高效的轻松的掌握数据结构,算法,编译原理,数学,工程等专业知识在项目代码里如何运用来实现技术产品,推动技术生态发展,实现技术研发创新的时候 ,说明你真懂编程了。