天贝合历史十倍股分享-SCALE AI
点击蓝字 关注我们
从零到500亿
图1:福布斯杂志封面 来源:网络
Alexandr Wang-年仅25岁的美国硅谷科技新贵登上福布斯杂志封面,被誉为新一代科技商业奇才;而他的公司仅成立于2016年,最近一轮的融资,公司的估值已经达到了73亿美金,成为福布斯排行榜上最年轻的创业者。
AI时代三大基石:数据,算法,算力,而Alerxandr的创业方向就是数据!
01
天时:
人工智能风起云涌,2010年以来,以谷歌为代表的大公司和高校的人工智能实验室推动了人工智能技术的突飞猛进,华人科学家李飞飞为推动人工智能的技术的突破,设计的标注图片数据库有160多个国家,接近5万名人员参与,上传了10亿张的标注图片,为训练人工智能提供燃料并且为人工智能的发展开辟了新的方法,同时也让可识别的数据成为了人工智能发展道路上的障碍!
2016年谷歌DEEPMIIND开发的AlphaGo人工智能的横空出世,让所有关注这个领域的人看到了产品化和商业化的可能性。
Alexandr Wang出生于1997年。他原本是麻省理工的学生,却在刚入学不久就辍学创业。公司成立时2016年,他才刚刚19岁,Alexandr Wang在创业初期,遇到了同样卡内基梅隆大学的辍学者Lucy Guo,两个年轻人的相遇和联手,才促成了这家有史以来营收增速最快的公司之一。
图1:合伙人合照 来源:forbes
前沿科技行业创业九死一生,在行业发展的前期,选择最佳的介入点几乎能决定生死,而SCALE AI选择是人工智能的燃料-数据的处理,既是一个消耗品,又是一条长长的赛道,同时又是所有人工智能公共的上游供应商;是人工智能时代必定受益的关键环节;风险投资公司Accel的合伙人Dan Levine看中他们的潜力,拿出450万美金作为种子投资,并将自家地下室借给他们做公司,SCALE AI 快速起步。
02
地利:找到可商业化的行业
汽车的电动化和智能化大变革,特别是对自动驾驶的冲减,使得该行业的数据爆炸性增长,且对数据的标注工作就成为了一个新的以资本驱动的商业机会。
从全球范围看,汽车是最大的一个行业,商业项目最容易在这个行业落地。
人工智能模型训练让可识别的数据成为了人工智能时代的石油和电,初期爆发性增长,远期看不到天花板,早期的爆发的数据分别来自于通用大模型的训练和自动驾驶的训练,SCALE AI首先从自动驾驶的数据处理入手,马上就有收入,长期的空间又非常大;给汽车公司及相关公司处理数据,以帮助其实现汽车的自动驾驶,在真正的自动驾驶落地之前,数据数量源源不断且数量巨大(后又进入其他的行业,比如政府,医疗,税务等)。
在汽车领域的快速落地,吸引了很多投资人的关注,2019年,Peter Thiel的创始人基金注资1亿,将Scale AI打造成硅谷独角兽公司。公司 2021 年 4 月完成 $325M 的 E 轮融资,投资者包括 Dragoneer、Greenoaks、Tiger Global 等,估值达 $7.3B。
03
护城河:先发优势和更多数据带来的规模效应
图3:人工智能的应用 来源:网络
在人工智能领域,数据标注属于苦活,累活,且不那么高科技,大公司倾向于把这部分工作外包,外包给不发达国家的团队。
早期,数据全部由人工手动标注,以构建和积累机器学习模型的训练数据集。尽管耗时且成本高昂,但手动标注数据确实在准确率等方面具有优势。数据标注公司往往在菲律宾、肯尼亚、委内瑞拉等劳动力价格较为低廉的国家或地区寻找合适的数据标注人员。
图4:标注流程如上图 来源:网络
这样做面临的问题:
1,效率非常低;
2,标注的质量参差不齐;
3,道德的压力
SCALE AI公司给出的方案:自动标注+人工协助
第一步,Scale ai首先训练自己的标注机器人(AI软件)
图5:标注机器人流程图 来源:网络
通过给模型不停的导入人工标注的数据来训练标注机器人
第二步
图6:训练后的标注机器人流程图 来源:网络
标注机器人大幅度提高了标注的效率,人工辅助保障了标注的质量;完成同样的数据标注,大幅度减少了人工的枯燥工作。
在此前,机器学习需要有监督学习,需要标注大量数据。随着模型逐渐变大,对数据量的需求变大,标注数据的时间及成本变得无法控制,高质量的标注数据的生产速度难以满足大模型的需求。但无监督学习出现后,机器学习不需要明确目的的训练方式,也无法提前预测结果,因此不需要标注数据。强化学习也不需要数据标注,强化学习的反馈不是通过标签或数值,而是通过奖励机制来学习一系列行为。
从以上可以看出,SCALE AI的标注机器人(AI软件)随着数据越多,SCALE AI的机器人越强大,效率越高,标注的质量也越高!更强的标注机器人带来更多的客户,更多的数据,进一步增强标注机器人的能力!
在规模效应的加持下,公司的护城河有可能王品牌方向转移,因为SCALE AI处理的数据质量高,在巨型公司的背书下,极大的可能已经在往品牌效应方面过渡。
AI软件训练中的壁垒:
1、整合-高技术人才和具体应用/场景人员的磨合,协调,争吵所能达成的合理的参数,双方都要抛弃成见,傲慢以及经验,甚至利益,理性客观的评估现实,共同参加模型调参,该工作极具艺术性,而非标准的正确性,需要多方的磨合。
2、人与AI机器人的互动,人对AI机器人的理解越深,对AI机器人的使用效率越高,使用准确性越好,拥有与AI计算机交互的运营工程师会大幅度提高数据标注的效率和质量。
04
人和:激情及对科技前沿的好奇
两位创始人对科技前沿充满了激情,在中学时期就是科技达人,且极具商业化动力,在Scale AI走上正规的时候,Lucy保留股权,离开了ScaleAI, 成立投资公司投资公司Backend Capital,专注于人工智能领域投资!而Lucy离开并不是创始人的不和,而是面对人工智能时代涌现的机会更激情的投入!