返回
观点

95后估值1000亿!马斯克、奥特曼背后的天才少年

2025-01-13 00:300

  这位在硅谷被称为“下一个扎克伯格”的天才少年,在2022年借助着生成式AI的浪潮,成功登上《福布斯》全球亿万富豪榜,也凭此成为了史上最年轻的白手起家的亿万富豪。

  但在今年5月,随着Scale AI宣布获得10亿美元融资,估值138亿美元(约为人民币1000亿元),亚历山大·王也再一次回到大众的视野当中。

  从2016年创立到成为千亿估值的独角兽企业,亚历山大·王和Scale AI用了短短8年的时间,而凭借着Scale AI,亚历山大不仅在AI数据标注行业上演了一段传奇创业故事,也在全球AI热潮中扮演了一个“卖铲人”的角色,为马斯克、奥特曼、扎克伯格等一众科技大佬提供数据支持,某种程度上来说,他影响了整个AI世界的格局。

  小学时,亚历山大便展露出数学天才的一面,到了初中,亚历山大就读于顶尖私立名校洛斯·阿拉莫斯,数次在美国数学人才选拔赛中拿下铜牌、金牌等;

  上了高中后,亚历山大又自学了编程技术,成为美国计算机、物理、数学奥林匹克竞赛上的常客,成绩均名列前茅;

  就收到了多家硅谷科技公司的工作邀请,他先是去了硅谷最热门的财富投资大数据管理平台Addepar,之后又加入了“海外版知乎”Quora从事编码工作并担任技术主管。

  考入麻省理工学院(MIT),主要攻读数学和计算机专业。根据领英(linkedln)的个人资料显示,

  也正是在其麻省理工学院上大一期间,DeepMind推出的AlphaGo,战胜了围棋世界冠军,开启了人工智能的元年和深度学习的热潮。

  “我记得当时我在大学里,尝试使用神经网络,尝试训练图像识别神经网络。我很快意识到,这些模型在很大程度上只是数据的产物。”

  在当时,已经有公司在研究算法,比如OpenAI或Google的实验室,或者其他一些AI研究机构;至于算力,英伟达也已展示出了为这些AI系统提供算力的领导者潜力。

  决定从MIT辍学,与此同时Lucy Guo也从卡内基梅隆大学辍学,两人一同创办了Scale AI。

  亚历山大回答道,差不多吧,搞了个AI公司,还有个叫Sam Altman的给我投了点钱,对了,airbnb(爱彼迎)也是他们投的,现在估值也就300多亿美金吧。

  除了拿到Y Combinator(山姆·奥特曼时任总裁)的天使轮投资,在创立第一年,Scale AI还拿到了风投巨头Accel的A轮融资。两方资助下,Scale AI初期的资金障碍被扫清。

  因此,Scale AI早期的定位就是通过结合自动化技术与人力审核,创建一个高效、精确的数据标注平台,为创建机器学习算法的公司快速处理和标注大规模的数据集。

  是指为图像、文本、视频或音频等原始数据添加结构化信息,以便机器学习模型能够理解和学习这些数据的过程。

  通俗来讲,就是给你一段视频或图片,让你分门别类地标出里面的行人、车辆、建筑等元素,某种程度上,这是个小学生也能做的事。

  虽然原理很简单,但这些经过标注的数据对于人工智能的发展不可或缺。AI模型需要大量的标注数据来进行学习,才能具备识别、分类和预测等功能。

  但为了得到高质量、高精确度的标注数据,仍然需要大量的人工来处理、标记和验证数据,尤其是在一些如医疗、自动驾驶、军事等对高精度有要求的领域。

  事实上,在Scale AI崛起之前,数据标注行业在AI领域长期处于“边缘”位置,其对大量人工的需求使得外界打上了劳动密集型产业的标签。

  在8年时间里干出了一家估值千亿的AI独角兽;在2023年《时代周刊》发布AI领域最具影响力的100个人物中,

  尽管数据标注看起来是一个低门槛、劳动密集型的行业,但在2016年的节点,它却是一个为数不多的空白市场。

  除了谷歌、亚马逊等少数大厂因业务需求设立了自己的数据标注部门外,大多数公司不愿意也没有精力去自己管理,这导致标注数据的获取的过程耗时且昂贵。

  而这也正是Scale AI“卖好铲子”飞速发展的机会所在,并且再回顾Scale AI八年的发展历程,

  2016年是AI时代的元年,也同样是自动驾驶周期的起点,在那一年Cruise被通用以超10亿美元的价格收购。

  自动驾驶技术的发展依赖于大量高精度的标注数据,比如道路场景、行人和其他物体的图像数据,车企需要成千上万小时的视频数据进行标注来训练和验证其算法。

  “我们构建了第一个支持传感器融合数据的数据引擎,支持2D数据和3D数据的组合,即激光雷达加摄像头,这些设备安装在车辆上,这很快成为整个行业的标准。”

  通过建立高效的数据标注平台,以及使用模型辅助标注和数据预处理来加速了数据处理流程,使得标注成本和时间得到大幅度降低,很快Scale AI就吸引了通用汽车、丰田和Waymo等车企的合作。

  而在2019~2020年期间,这个阶段自动驾驶行业技术方面已基本成熟,加上当时语言模型和生成式AI还未诞生,人工智能领域处于一个高度不确定时期。

  和Scale AI开始专注于政府应用,“这是一个显然具有高度适用性的领域,并且在全球范围内变得越来越重要。”

  Scale AI也从过去单纯的数据标记延伸到数据服务,提供从数据标记和管理、模型训练和评估,再到AI 应用开发和部署的全流程解决方案。

  在之后几年时间里,Scale AI在数据领域迅速崛起,客户也扩展到了医疗、国防、电商、政府服务等领域。

  另外,为了应对某些行业数据不足的挑战,Scale AI还向下游延伸到合成数据的生成,通过从现有数据中创建新的数据集,帮助训练模型。

  Scale AI在这一阶段也开始致力于生成AI,与OpenAI开展合作,在GPT-2上进行RLHF的首次实验。

  “当时的模型非常粗糙,真的看起来不怎么样。但我们认为OpenAI是一群聪明的人,我们应该与他们合作。所以我们与发明RLHF的团队合作,并从2019年开始不断创新。”

  ——生成式AI模型需要海量的训练数据来提升其生成内容的准确性和多样性,加上大语言模型的爆发式增长极大推动了整个行业对高质量标注数据的需求。

  到了今天Scale AI更是成为了通用AI的数据铸造厂,为OpenAI、meta、Microsoft等行业内几乎所有主要的大型语言模型提供支持。

  因为美国人力成本高昂,在linkedIn、indeed等平台上,数据标注的兼职时薪大多都在30-200美元之间,但作为一个劳动密集型业务,这在客观上就要求企业去思考解决数据生产问题,或者采购相关服务。

  于是在2017年,Scale AI 成立了 Remotasks 作为其内部外包机构,在肯尼亚、菲律宾、委内瑞拉等地设立了几十家机构,在世界各地培训了成千上万的数据标注员,这些标注员的工作大部分都是按件计酬,一次标注的收入低至几美分,很多合约工在时薪甚至不到1美元。

  曾有业内人士指出,“Scale AI不是一家人工智能初创企业,它只是一家提供廉价劳动力的公司”。

  但不管外界如何质疑,无法否认的确是,在这样的“全球工厂”模式下,Scale AI的毛利率长期保持在65%以上,Scale AI也成为了当下AI领域为数不多不需要烧钱,而是狂赚钱的AI初创企业之一。

  2023年,Scale AI年化收入高达7.5亿美元(约合54.3亿元人民币),预计2024年底将达到14亿美元(约合101亿元人民币)。

  刚创立时,就分别获得硅谷著名孵化器Y Combinator和风投巨头Accel的支持,前者的时任总裁山姆·奥特曼在后面的OpenAI又与Scale AI 开展了合作,而后者机构的合伙人还曾将家里的地下室借给Scale AI临时办公。

  而此后5、6年时间里,Scale AI也基本是一两年就融一次资,而参与投资的机构和个人在这个过程中显然也不止是进行资金上的帮助,更是在多方面都进行了助力。

  2024年5月,Scale AI再次官宣完成F轮融资,融资额10亿美元,估值增长超过80%至约138亿美元(约1000亿人民币),投资方阵容堪称史诗级豪华,20多家机构和个人:

  尤其是在生成式AI热潮前,国内的人工智能行业在应用方面一度领先,并且数据标注作为劳动密集性企业,中国天然就有优势。所以为什么呢?

  就是指一个国家或地区拥有丰富的自然资源,但因为过度依赖这些资源,忽视了其他潜在的经济增长领域,

  如制造业、服务业和技术创新等,导致经济发展单一、结构不合理,同时随着这种自然资源枯竭或市场需求下降,经济可能会遭受严重打击。

  典型的例子便是委内瑞拉、俄罗斯,它们依靠石油、天然气等赚取大量的外汇,但除了能源行业外,其它的经济产业都非常落后,

  很多龙头企业虽然成立了数据标注部门,但主要是为自身业务服务,而并不是寻求将数据与各个行业进行资源匹配;

  加上依靠国内的人口红利,让标注后的数据获取成本变得十分低廉,哪怕是今天国内的数据标注价格依旧偏低,拿重庆这种新一线k/月

  在这种情况下采用技术平台或者进一步研发来提高数据标注或是从标注行业进一步向上延展创新,对于处在市场竞争中的企业而言,可能反而是得不偿失的做法。

  但一旦在这个阶段错过了对数据标注行业的技术创新或沉淀,也许就永远地错失了创新升级的机会了。

  一是单纯从语言生态来讲,必须要承认,英文的使用范围是全球,而中文的使用范围更多还是在国内以及海外的部分华人。

  所以在数据标注这一产业上,Scale AI天然就有了优势,站在资本的高地,在全球范围内寻找着价值洼地,而国内哪怕是有人口红利,这成本优势终究更高,且在资本(投融资)方面也没有占据高地。

  而这也使得数据在流通上出现了阻碍,甚至可以说当时的数据标注行业也被迫参与到这种对抗封闭的生态中去,各为其主、各自而战,无法形成有效的、规模性的创新力量。

  事实上,大多数参与到数据标注行业中的人,更多就是秉持着过往的劳动密集型产业的逻辑,靠着“内卷”来实现生存以及盈利的。

  人们已经用尽了互联网上的所有数据,想要开发出比GPT-4.5更强大的人工智能,则必须构建前沿数据。

  所谓的“前沿数据”是指那些与应用场景密切相关、能及时反映最新趋势和变化的数据,往往包含大量长尾或少见的场景,有助于提升AI在非典型情况下的表现,推动人工智能

  随着AI的快速进化,未来的数据训练需要更多地与特定任务、特定应用场景相匹配,因此也需要挖掘和生产出更多新的、差异化的数据,而这可能也正是亚历山大在2016年时就看到的未来。

  Scale AI作为一面镜子,其从最“廉价”的行业中成长为一个估值千亿的AI独角兽企业有太多可以学习的地方了。

  731部队是日本军国主义者在第二次世界大战期间下令组建的细菌战秘密部队之一。1931年到1945年期间,731部队进行骇人听闻的人体实验和细菌战等,在中国犯下滔天罪行。数千名中国、苏联、朝鲜战俘和中国平民被用于人体细菌和毒气实验。

  根据河北省地震局消息中国地震台网正式测定:1月12日9时54分河北沧州市任丘市发生3.4级地震震源深度13公里震中位于北纬38.58度,东经115.

  “您好!我们是辖区鲤鱼山派出所的民警,巡逻时发现您的车辆没有锁,后备厢内有大量现金,请尽快过来检查车内财物,并将车门锁上。

  深圳小学数学试卷难上热搜:有家长85分钟才做完,中学数学老师:我都写不完!网友:四年级正是考公的年纪!

  近日,深圳南山区小学数学期末考试登上了热搜,因为真的是太难了。因题目过难,阅读量过大,不仅是四年级,参加数学考试的多个年级都出现了延时情况,原本计划90分钟的考试时间被迫延长至110分钟。

  被学生打致抑郁,男老师看病途中跳河自杀!工伤官司7年15次来回!当地人社:就是不认!法院:算!必须执行

  男老师因被学生殴打,出现应激障碍患上抑郁症,在看病途中跳河自杀,算工伤吗?市人社局:殴打受伤算工伤,自杀不算工伤!家属:明明是因为工作原因,为什么不算?!怒将市人社局告上法庭!案件打了7年,历经15次来回,终于尘埃落定…事件回顾陈某曾在福建省台溪中学任教。

  在我们的生活中,高血压是一个常见且需要高度重视的健康问题。它就像一个隐藏在暗处的 “健康杀手”,悄无声息地影响着许多人的生活质量,甚至威胁着生命安全。

  据都市快报消息, 1月9日下午3点50分左右,日本兵库县的两名中国女游客在铁路道口等红绿灯时遭列车撞击身亡。一男子发现两名女子重伤倒地后报警,其中一女子当场身亡,另一女子送医后身亡。 警方在两人的随身物品中发现中国护照。

打赏
  • 0人打赏
    举报
关闭
同类新闻