本文共 5425 字,大约阅读时间需要 18 分钟。
对2016年的姜意来说,过去十一年是一条蜿蜒的盘山公路。从2005年那个起点,他还看不到自己做的事跟核磁共振成像、用影像识别减少癌症误诊,甚至描绘大脑地图的中国脑计划有任何的关联。
2005年,姜意从武汉理工大学的计算机系毕业。他很快在上海徐汇区一座普通写字楼里租下一处办公点。这间最初只有一个人的公司为一些稍大的企业提供IT设备并编写一些简单的软件。接下来五年,他的公司两度陷入发不出工资的拮据,姜意在其间突然白了头发。2011年,公司调转方向跟中科院上海神经所开始了一项核磁共振成像的研发合作。这个项目在当年亏损,却成为他们进入科研和医疗的转折点。2016年,姜意的公司成为中科院、高校和三甲医院的供应商,是上海地区少有的熟知高校、医疗领域科研IT需求的系统集成商。
雷锋网在2016 HPC China上采访了姜意。在超过十年的辗转之后,承蓝科技已经从一个小作坊,变成了时下IT技术公司们最愿意结盟的一类合作伙伴。尽管还是规模不大的公司,他们在残酷的环境中生存下来,熟知某个细分行业一线的需求,同时对新技术敏感开放。当我们大谈人工智能、深度学习这些新浪潮时,往往是这批熟知行业的公司过渡了技术前沿与一线应用之间的隔阂。
2015年的承蓝科技有3000万左右的营收,它距离一家商业上非常成功的公司依然非常遥远,但距离姜意这个个体多年前出发时想要的“做一点事出来”是有一点点靠近了。
以下是承蓝科技姜意自述,雷锋网(公众号:雷锋网)整理。
从学校毕业后,我加入了一个朋友的公司,做技术方面的工作。那是个短暂的经历,积累了一点人脉和资源,但朋友公司很快倒闭了。我就想继续在这个领域走下去,然后就开始自己创业。
那时候还没有明确的创业的概念,比较简单,比如说写写小的软件,顺带围绕着卖卖各种设备和服务。2005年,在上海徐汇一座普通写字楼里租了一个小办公室以后,一家一个人的公司就这样办起来了。当时这样的公司很多。
写字楼里没有客流,客户都是我们主动联系的,要翻企业黄页、打电话。当时客户都是一些很小的企业,都是几十个人的岗位。我们给他们写一些工具软件,像信息管理、经销存之类的,然后在适当地卖各种设备和服务进去,比如说服务器、电脑等等。
那个时候,技术含量比较低,像个作坊。到了07年的时候,公司还是很小,因为很多东西没有规范好,就造成了一些帐款回不来了,我就老去客户那边催款。
有个经历让我印象特别深,对方快要倒闭了,公司其实也不是特别小,还是有厂房的那种。然后我就跟他们老板说,必须得给我钱,这差不多是我们生存的根基了。印象中那笔钱大概有十几万吧,我赚的只是其中很小一部分,但是可能连本钱都收不回来了。我就一直待在那里,待了一个礼拜。一个礼拜以后,我发现基本上要也要不回来了,与其天天时间耗在这里,不如把它忘了,重新开始。
那是我们压力最大的时候,因为刚经历了赚到一点钱,然后陆陆续续各种收不回来,几乎让我们破产。我的头发也在那个时候白了。
重新起步的时候,就是从各种业务里抠一点钱出来,我还办了好些信用卡,因为不能违约,糟糕的时候一个月要还很多利息。也有朋友帮忙借一点。我们今天公司的自然人股东里面,就有一个是我们在04、05年就认识的。十年了,有时候有困难,他都是鼎力相助。
尽管这样,07年以后我们在业务上还是重复以前的老路。当时就是比较倔吧,必须得沿着这个方向做下去。一方面我对程序是非常热爱的,我们接的那些项目,软件全都是我一个人设计,一个人开发的,甚至经常写到三点多,然后周六、周日还得写,白天又继续工作的状态。我在心里想着这一次要规范一点,做得更好一点。我们想尽办法要活下来。
然后到了09年的时候,坏账的问题还是又来了。这里面有一些是金融危机的原因,很多小企业倒闭了。这让我特别灰心,我就想,从那个时间点开始,如果能找到新的方向,我就继续做下去,如果找不到可能就会放弃。各种生意不付你钱,或者回不了款,没有办法。我要找到一个永远不会拖欠我款的单位。
09年 - 10年的时候,我们挑选了原来规模大一点、信誉好一些的企业,做了一些活,让公司稍微盘活一点,加上账上还有一点点钱剩下,我们要开始和原来一些业务做一个了断了。
到了2011年,是我们比较重要的一个节点。我就开始转向到科研或政府的业务上去。当时想的很简单,因为前面受了太多委屈,突然到了一个单位,一些客户上,这些客户永远不会欠你钱。你会做很多努力,不管各种技术方案,让他认可你,然后做完这些项目,也不会拖欠你的帐款。这就能非常开心地做下去。
在这之前我们从来没有跟政府和科研单位合作过。那个时候他们的很多设备采购要走中央政府采购的网站,我们就去里面研究它的需求。各种上海的部委、海洋局、海事局、海关、中科院等等这些单位,上面有很多办公室的联系方式,我们就打了大量的电话,去沟通、了解。2010年那一年,我们几个人就天天、每天研究它。
在这之前,这些单位的供应商主要是惠普、戴尔、联想这些IT公司,还有下面的代理商、经销商。经销商们在想的事情是客户需要什么东西,他会告诉你这个产品多少钱、多少报价,而我们实际上关注买这个东西做什么,为什么要买这些,我们怎么帮你把事情做好,我们很多客户的预算、甚至方案都是我们帮着写的。我带着工程师,一个一个客户地从早到晚,一个一个敲定方案。每天就是早六点,晚上十一点,整个团队都这个状态。
结果当然是我们比那些IT大厂们、经销商们更懂他们,合同额也一年从四百多万涨到了九百多万、一千多万、两千来万,然后到去年差不多三千万左右。那时在上海这个采购的圈子还是比较小的,我们很快做到了这个领域排名靠前,比如国家海洋局东海分局、上海海事局、上海海关、中科院上海的各个研究所。他们的IT采购需求是一个很细分的市场,可能当时很多人没听过,更没有人像我们一样没日没夜地研究它。
我也发现,任何技术都是工具,最终最核心的都是业务,都是要解决什么问题,背后是什么问题,该用哪种技术手段。今天也是一样,任何一个科研,或者医疗,不管是云,还是大数据,还是深度学习,其实都是技术手段。
光是合同额的增长,只能说让我们生存下来。之前说我们特别关心用户的业务需求在哪。所以一关心呢,就发现在科研单位很多数据的分析,怎么去提升效率,是很普遍的问题。问题普遍的时候,就是我们的机会。
我们见到很多单位买了一堆设备,几百万甚至上千万投进去,但要让整个集群大规模、高效率真正运转起来,很难。比如用户要跑一个计算任务,可能设备就不停地出错。用户买了大量的服务器资源,想要去算一个业务,服务器就是不听指挥。他们在自己细分领域的研发,但是IT这块是比较弱的。
即使今天看到的高性能计算,用户买完计算资源之后,没有数据处理的平台,最后也有可能出现用不起来。在当时就更加没有人提供了。这对于我们是比较好的机会,那我们就全力以赴,盯在那个点上,然后一点点,放大,一点点放大。
我们在这方面的第一个业务是在中科院的上海神经科学研究所。我们跟科研单位、供应商们已经在打交道,就特别留意他们的业务里面,有没有一些前沿的方向。而神经科学研究所,属于脑科学方面领导地位的单位,我就特别关注里面的一点点风吹草动。
当时听说一个研究员刚刚从国外回来,要做核磁共振方面的项目。我判断核磁共振是一个非常有价值的设备,因为它在医疗里的应用很广,很多疾病诊断都跟核磁共振的分析有关系。之后就找人与那位研究员认识了,大家觉得可以尝试一起做一下,那就慢慢地从小问题,小需求一个一个去解决,相互开始建立很好的信任。
从2011年9月份我们正式投入到这个项目里,后来演进成一个核磁共振的数据分析平台。这个系统后来不停在完善,一直到2014年。这些业务延伸到我们今天服务的医院。
当年的这个项目大概是百来万的合同吧,我们做下来铁定是亏损的。因为我们投入了大量的人力和时间在上面,定了很多计划要实现的功能。那段时间很多东西简直是有点困难,非常有点困难。
每次发展得好一点,公司就租下来一个稍微大一点点的办公室,再坐不下,就再换稍微大一点点的。我们就这样搬了好多次家。更多的是遇到好多对我们当时来说,好困难的技术问题,非常有意思,也非常辛酸。 随着项目进行,团队有了很大变化,原先工程师只是解决各种支持问题,后来团队慢慢就偏向于开发,将很多项目成果都变成一个个成熟的模块。
那个时候我是发现那么多科研单位里的,客户还花那么多时间,去做一些重复性的工作,而且有时候还做失败了。因为科研日常大家都面临着各种数据,然后要分析,不是一台电脑能做的,需要大量的计算资源。对科研单位来说,最好的方式其实它是有一个程序就能做好,但是实际上没有。那就要他自己去买各种设备,各种的服务器、各种各样的软件,自己尝试做这种开发。这对科研来说是一个不该有的现象。可能国外比如一个高校,它是有一个大的团队在支撑这些IT工作,包括机群怎么建,软件怎么开发。而在咱们国内基本上都是各个实验室自己在弄。我们就相当于承担这个角色。解决好这个问题,我们自然会有一个价值。
后面的项目,因为核磁共振数据分析上,有些在蛋白质结构的研究上可以直接用起来,所以又在蛋白质结构这块做了好多合作,然后又跟基因测序的单位合作。基本上整个生命科学这条线上,既有我们找他们,也有客户推荐,就都开始合作了。
在我们做这些的时候,技术很重要。技术手段是一个我们实现业务需求的一个根本的工具,但它可能不是唯一一个。有时候实现一些业务,可以有好多个技术手段来做。整体上,这些年是越来越往云端、低成本和软硬件一体化来走。
2011年中科院神经所的项目我们做了第一台云服务器,那时候应该还没有云服务这个说法。一个是设备放在本地比较吵,集中管理利用率高,成本更低,可以快速地做一些预览工作,不受地域限制。
我们在GPU这块的应用也越来越多,一开始是做一些数据分析,需要图象做三维重构、分割、渲染。后来涉及到运算的需求越来越大,CPU的需求和成本都越来越高,我们想帮用户节省更多的成本,就开始尝试用GPU做更多的数据运算。我们跟NVIDIA的深入合作也是从那个时候开始的。
在15年,我们把之前做的所有项目基础都浓缩成了各个模块,这样加上服务器、存储这些东西,就逐渐成了整个面向行业的云服务,成了软硬件一体化的模式。
也是在15年年初,我们有一个机会接触到中科院在探讨启动中国的脑计划,脑计划就像当时的人类基因组计划一样。美国在13年,后来日本、欧盟都启动了脑计划,美国投入了45亿美元,欧盟也投入了几十亿欧元。
脑计划要启动的时候,它缺少很多数据分析的平台,以及怎么去建立更多的数据库。我们刚好就很有幸,因为那时候一些项目已经可以看到成果了。我们就成了脑计划一个关联项目的合作伙伴,项目叫中国科学院战略先导B类脑功能连接图谱。然后我们就在里面,做了更大更长远的规划。实际上脑计划目前为止还没有正式启动,我们的参与度有多少可能还是未知的。我们都觉得这是一个非常大的机会。
所以那个时候开始,我们就考虑可以用人工智能的技术做一些医学影像的分析、诊断,这可以解决这些很多领域的问题。
这几年里我们一直发现,科研单位跟医院的合作是非常紧密的。医院有大量的数据,如果这么一套系统,让他们能快速处理分析这些数据,那这部分工作就变得比较简单了。我们就开始相互有一些了解和接触。
我们第一套在医院落地应用的系统,是16年才完成交付的。在上海市精神卫生中心,这是长三角或者全国精神类的疾病研究里面很专业的一家单位。他们的病人涉及到抑郁症、精神分裂症,还有吸毒成瘾,各类的症状,都是跟大脑有关的疾病。相比肿瘤,目前跟精神类疾病的合作还不够深,精神的疾病实际上很多时候都是在脑袋这个层面有好多原因,它不能那么明确地被量化。
我们跟他们的合作,首先是把他们的数据采集、存储的标准,开始制订起来,然后用这样一套系统,数据就能非常标准化地产生了。以后产生的每个数据,逐渐都会形成庞大的有效数据。相比以前的那些数据,可能只是放在那边。
另一方面是肿瘤的疾病诊断。我们发现各种癌症的数据反映,如果能早期地去做筛查的话,病人的五年存活率就会大幅提高。病情都是越早发现,越早治疗,成功率越高,成本越低。但肿瘤的诊断过程复杂,很多肿瘤都依赖核磁共振的数据,扫描时还有各种手段、各种序列,检查不同疾病,所用的方法和看到的结果都是不一样的,如果说普通拍片子是傻瓜式的iPhone,那这个就比单反相机还要复杂。还有现实情况是,这些数据出来之后要做分析,一方面需要的时间很长,另一方面医生很忙。所以大部分医生根本就没有时间去做额外的研究。
我们希望的就是,在存储、分析之外,能够帮助医生做更重要的工作,甚至参与一些诊断、辅助诊断、复核这样的工作。
我们在跟医院的合作里,近期用深度学习的方法来作为在乳腺癌的诊断训练,我们现在在训练里达到了87%的准确率。在前列腺癌上,目前准确率大约在72%。这都是跟医院的医生合作的成果。
我们未来可能就是围绕科研和医疗这两个领域了。这五年、六年接触下来,好多研究人员都非常非常正能量,他们甚至比我们还忙,在过年假期的时候还在跟我们来回讨论很多问题。我们希望帮他们来提升效率,让这些科研、医生有更多的研究成果。
本文作者:吴德新
本文转自雷锋网禁止二次转载,