Untether AI Corp.由 Darrick Wiebe, Martin Snelgrove 和 Raymond Chik 创立于2017年,总部位于加拿大Toronto,Untether AI 开发 AI 芯片以开启 AI 应用的新领域。
Untether AI Corp.美股百科
Untether AI 正在创建一类新的专用处理器,目标是能源复杂性规模的极端点。 通过尽可能消除复杂性,同时仍然能够执行进行神经网络推理所需的操作并将该处理尽可能靠近内存,Untether AI可以接近给定工艺的理论最小功率数(最初针对 28nm )。
神经网络推理将在所有类型的设备上变得越来越重要。 这些设备以严格的能量预算运行,这在某些情况下对于任何当前的推理技术来说都过于严格,而在其他情况下,由于最大推理吞吐量而限制了整体智能。 Untether AI 的独特定位是通过架构来解决这个问题,该架构以最小功率最大化推理输出并且完全可扩展。
Untether AI Corp.产品百科
2 PetaOps of Performance in a Single Card
tsunAImi 加速卡由 4 个 runAI200 设备提供支持,提供 2 个 POP 的计算能力,是任何可用产品数量的两倍。 这种计算能力可以转化为每秒超过 80,000 帧的 ResNet-50 v 1.5 吞吐量,batch=1,是市场上其他产品吞吐量的三倍。对于自然语言处理,tsunAImi 加速器卡每秒可以处理超过 12,000 个 BERT-base 查询 (qps),比任何已发布的产品快四倍。
The Most Efficient AI Compute Engine Available
runAI200 设备专为推理加速而设计,使用整数数据类型和批处理模式 1 运行。其独特的内存架构每秒提供 502 TeraOperations。 它还可以配置为实现最高效率,每瓦提供 8 TOPs。 runAI200 设备采用具有成本效益的主流 16 纳米工艺制造,并采用冗余来确保高良率和低成本。
imAIgine Software Development Kit – Simple, Automatic Tool Flow
Untether AI 的 imAIgine 软件开发套件 (SDK) 提供了一条自动化路径,可通过按钮量化、优化、物理分配和多芯片分区以高性能运行网络。imAIgine SDK 使数据科学家不必执行低级优化任务,而是将时间花在对他们重要的地方——制作他们的模型。 imAIgine SDK 还提供了一个广泛的可视化工具包、周期精确的模拟器和一个易于集成的运行时 API。
Untether AI Corp.技术:
Untether AI 旨在解决 AI 工作负载的关键计算和效率瓶颈——内存访问和数据移动。
随着 AI 应用程序的爆炸式增长,对神经网络的性能要求每 3.5 个月就会翻一番。 发生这种情况时,正在计算的大量数据使基于经典冯诺依曼架构(von Neumann architecture)的系统和硅资源变得紧张。AI 工作负载中超过 90% 的功耗来自数据移动。 Untether AI将计算元素移动到存储数据的位置,将数据传输的功耗降低了 6 倍。 这是一项根本性的创新,使公司能够提供前所未有的计算密度,不受传统方法的束缚。
runAI200 代表了一种新的计算方式。Untether AI重新编写了计算架构的规则。 runAI200 架构专为 AI 推理工作负载而设计,可为运行神经网络提供一流的性能; CNN、RNN、TCN、注意力、变压器、Unet 和 DLRM。独特的内存计算架构的核心是一个内存库:385KB 的 SRAM,带有 512 个处理元件的二维阵列。 每个芯片有 511 个银行,每个设备提供 200MB 的内存,足以在单个芯片中运行多个网络。 借助 imAIgine 软件开发套件的多芯片分区功能,可以拆分更大的网络以在多个设备上运行,甚至可以跨多个 tsunAImi 加速卡运行。
Untether AI Corp.应用领域及案例:
1、金融科技(Financial Technology)
无论您是执行投资组合平衡、降低风险还是欺诈保护,您都需要拥有低延迟、高性能的神经网络。 凭借 2 PetaOps of batch = 1 performance,tsunAImi 加速器卡以惊人的低总拥有成本 (TCO) 提供可用的最高吞吐量。 灵活的 runAI200 设备架构允许您使用相同的工具流程部署时间卷积网络、递归网络、自然语言处理和视觉网络。
2、智慧城市(Smart City)
当尝试同时分析数百个视频通道以提取可操作的情报时,您需要最大程度的神经网络加速。 每张 tsunAImi 加速卡可以同时分析 400 多个运行高精度神经网络的全帧率摄像头。
3、智慧零售(Smart Retail)
跟踪消费者行为、提供即取即用功能或管理库存收缩可能会迅速压倒现成的服务器计算能力。 通过在 tsunAImi 加速器卡上运行神经网络,您可以更快、更节能地运行更大的网络,从而显着提高吞吐量和准确性。
4、工业视觉(Industrial Vision)
对于视觉引导机器人、自动引导车辆和工厂车间的视觉检查,复杂神经网络的多个通道需要同时实时运行。 无论您是运行语义分割还是对象识别,单个tsunAImi加速卡都可以以极低的延迟分析8路高清视频。
5、AI as a Service (AIaaS)
对于那些希望以最高计算密度和最低总拥有成本 (TCO) 提供 AI 加速的用户,tsunAImi 加速卡可提供最高能效和最低资本成本。 无论您是测量每瓦每秒帧数(对于视觉系统)还是每瓦每秒查询数(对于自然语言处理),tsunAImi 卡都能以无与伦比的计算密度将吞吐量提高 3 倍,能源效率提高 2 倍。 所有这些都意味着用于横向扩展的资本支出和运营成本更低。
Untether AI Corp.融资百科
- 2019年4月-2020年7月,Untether AI Corp.先后完成A轮1300万美元融资、A1轮700万美元和A2轮700万美元融资,由 Intel Capital 和Radical Ventures 共同投资。
- 2021年7月,Untether AI Corp.获得 Intel Capital, Tracker Capital Management 领投的1.25亿美金风险投资资金,Canada Pension Plan Investment Board和Radical Ventures跟投。
Untether AI Corp.美股投资
非上市公司,等待Untether AI Corp. IPO上市。
评论