5月14日,随着太空计算卫星星座当天在酒泉卫星发射中心取得成功,由杭州之江实验室协同全球合作伙伴共同打造的“三体计算星座”,千星规模的太空计算基础设施,正式进入组网阶段。
该设施将通过在轨实时处理数据,解决传统卫星数据处理效率瓶颈问题,推动人工智能在太空的应用与发展。
无责引用朋友圈的说法,工业级FPGA已置身其中。虽然已非新鲜事,但与网络上远观的感受不同,就在身边发生,仍然颇受震撼。
作为空间飞行器的关键使能技术,加之对数据、图像、算法以原地原位方式,进行近数据源加速处理,正是其强项,完美契合“天数天算”的端侧应用场景。
之所以没有采用宇航级FPGA,原因估计也很简单,芯片价格及综合成本!
既要高性能,也要低成本,商业航天大量涌现的这些“既要又要”的新需求,可能也是其与不计成本保可靠性的传统航天,两者最大不同之处。
按照复旦微《高可靠集成电路产品及应用解决方案(2024【第一版】)》的说法,其对标国外竞品的90nm芯片JFM4VSX55RH,是千万门SRAM型抗辐照FPGA产品,功能上兼容Xilinx XQR4VSX55产品,辐照性能大大增强。
“是国内最强,业界领先的一款抗辐照FPGA产品,可广泛满足航天应用需求。”
但对于“NTN卫星通信网络”等低轨卫星通信市场,很难成为多快好省的“主流”选择。
再者包括车规级、工业级、消费级在内的COTS器件,今非昔比,已经成为新型航天Newspace的主流选择,FPGA芯片自然也不会例外。
从聚焦筛选(Screening)进展到拿来即用(Use an it)
毕竟商业航天追求的可是低批快三要素,低成本、批量化和快速生产部署。
能用便宜的就绝不会用贵的,可谓是
“Their Price go High, Our Price go Low”
政治素人、工程巨子的马斯克,无疑是这方面的集大成者,旗下从运输工具,到Starlink星链、Starshield星盾中使用的FPGA。
虽然动辄几十亿的SpaceX火箭说炸就炸,经常放烟花,但对芯片是真“抠门”,能省则省。
早年就有“龙飞船主控系统的芯片组,传闻仅花费2.6万人民币”的壮举。如果使用传统的抗辐射计算机,单个控制器可能就需要500万,整套系统是1.4亿,成本仅是后者的不到万分之二。
而在传统航天领域,也有NASA研发的第一代空间高性能计算机(SpaceCube),提供关键交汇对接信号,完成哈勃望远镜的维修任务。相比之下虽然是“小打小闹”,但使用的是赛灵思90nm普通芯片 Virtex-4 FX60,属于工业级 FPGA在太空应用的先驱了。
如果使用传统方式完成同样的工作,需要的抗辐射计算机将多达25台。
宇航级CPU芯片性能虽然拉跨,但价格感人。从性能表现仅为3 MIPS的MIL-STD-1750A,到性能是其100倍,BAE System公司的“通用型”RAD 750,则是高达20万美元。
地面商用COTS芯片在空间环境使用,仅是器件筛选(Screening)工序,成本足以上升1个数量级。以英伟达Tegra Xavier GPU为例,价格将“上涨”近20倍。
“普通”FPGA在天上飞的最大阻碍,如果借用@方丈 在《土地财政、居民收入与收入》一文中回复雪友@笔削春秋 的说法,可能同样是“摩擦性服务业价格昂贵”。
如果按照标准规范执行一套完整流程下来,直接导致成本像火箭发射一样飙升,干脆能省尽省。
这就像是与上医院看医生差不多,感冒发烧之类的“小毛病”,一言不合首先就是血常规又是尿检之类进行“全流程”筛查,有必要但非必需。
在NASA是创新先驱而非先烈的标杆示范效应下,越来越多的公司更为大胆。商业航天正成为创新实践的最大助推力,“试错”的应用沃土。在某种程度上,也正成为勇敢者的游戏。
因循“守”旧,墨守“成”规,而创新往往要“打破”规矩。
软件定义弹性计算的Resilent Computing公司,超越三模冗余设计,而更像有9个头的不死鸟一样,在太空恶劣运行环境下做到“生生不息”:在28nm的7A 200T芯片,构建多个软核RSIC-V处理器,有些类似“多核芯片”天然互为冗余的先进设计理念。
硬件可重构能力和大量的资源冗余这两能力,正是FPGA在包括航天在内的关键且重要行业应用时,就像是倚天剑和屠龙刀,行走江湖所依仗的法器。
由此产生的更深层次创新更是层出不穷。
航天产业正处于“一个巨大的拐点”,正从以前由政策与国防驱动的周期性行业,转为具备规模效应与网络效应的数字经济产业。
在硬件加速一切的计算普惠时代,软件正在定义一切。
软件定义卫星的Colossus Computing公司,直接使用商用FPGA和GPU,提供软件定义的通用计算平台。“在工业级芯片上构建可靠的系统”,提供边缘AI所需的高性能,并能够在太空恶劣环境下稳定运行。
公司以"Colossus"命名,致敬Colossus Computer——改变了战争进程的电子计算机,二战中被英国用于破译德国密码。并引用格雷斯·霍普,计算机编译器女王、美国海军少将的名言,作为公司致力于技术创新的注解:
"It's not that we need new ideas, but we need to stop having old ideas." — Grace Hopper
问题不在于我们需要新想法,而在于我们需要摒弃旧想法。
成立于2017年的初创公司Loft Orbital,看到了“由于高昂的成本和复杂的工程要求,大多数组织仍然很难将卫星发射到太空”的商业化机会,以“软件定义卫星载荷、共享基础设施资源”理念,使任何组织都可以购买到共享卫星的门票。
客户只需部署在轨软件,获得星上载荷服务,从而避免制造、管理和运营自有航天基础设施的高昂成本和复杂性。
年初完成1.7亿美元C轮融资后,已成为商业航天领域新晋独角兽。
从最早的空间高性能计算平台,小到太空嵌入式计算机,大到太空AI基础设施,普通FPGA或隐或现,一直深度参与其中。
随着全球化进入到以不信任为主基调的下半场,大国之间的芯片算力之争也开启了“打麻将”模式:麻将的内涵在于通过随机抓牌在混乱中创造秩序(茱莉亚·罗伯茨)。
全球地缘政治环境发生变化,即便是美国和德国、日本、英国等盟友之间,也会"同行竞争"或者"近同行竞争"。
既要盯住对家,还要防住上下家。
在科技创新前沿之一的深圳,保安机场树有这样的广告语:“但凡人能想象之事,必有人能将其实现。”
作为应用创新大国,更何况已经有大量初创公司的成功实践,国内以低轨卫星为代表的商业航天步伐,同样是越来越快。
距1箭12星成功发射三天之后,5月17日,蓝箭航天的新一代甲烷燃料火箭紧随其后,这次是1箭6星,覆盖天仪研究院20KG至300KG卫星平台产品,全部进入预定轨道。
Starlink星链中的小卫星制造成本,据说每公斤约2000美元,并且还有优化空间,非宇航级的FPGA芯片,自然成为其首选。
FPGA虽然可作为价格亲民的“ASIC”使用,按照在Xilinx、Altera两大头部厂商,以及通信大厂HW都有从业历练,仍战斗在一线的资深人士说法,做ASIC,厂家和客户是深度绑定,风险共担;
但是做FPGA,除了芯片质量问题,厂商和客户的责任是解耦的,所以对FPGA厂商来说,还是“老老实实做好自己的平台产品”,更稳妥!
话说一半,所谓责任解耦,可能也只是对“小”用户适用。
这可能多少也解释了,定位为全球第三家高端FPGA厂商的Anchronix公司,在生成式AI普遍已经做到“即开即用”的当下,最近在介绍旗下最新的7nm Speedster 7t FPGA如何部署llama3时,仍是“手把手”教用户的模特鱼方式。
如果借用雪友@三心五意 对Vivado开发软件的评价,仅是从处理大模型的流程图入手、剖析存储访问的次数、带宽,再做切分并行化等流程,就足以让人崩溃。
AMD目前市场份额最大,在航天市场也排名第二,是国产替代的重点对象。
目前有两种替代方式,一是像安路科技、紫光同创、中科芯磁等厂商,软件和硬件都是100%全自主的双一百模式,比如在硬件容量上留有适度的冗余资源,增大布线跑通的几率;
二是复旦微、紫光国微、成都华微等公司,采取直接做同款竞品模式,但需要在位流下载阶段“打补丁”。
在设计流程上,FPGA在位流文件载入芯片,就变成了用户定制设计的“ASIC”芯片,在小卫星等航天领域应用,还需要考虑“抗辐”因素,那么怎样快速评估应用设计是否已经足够“健壮”了呢?
红杉资本近期在硅谷的《AI的万亿美金机会》分享会中,认为AI应用已经到“鼓吹”卖成果的时候;而一份权威的《低轨商业卫星抗辐射设计指南》,至少对售卖在地面设计阶段快速搭建SEU仿真环境(SEU Emulation)等软件工具,无疑大有裨益。
包括故障注入测试在内的仿真在内,某种程度上,就相当于实际应用场景下简化版“数字孪生”。
所以,也相当期待韩建伟老师主持编撰的这份指南早些面市,让FPGA用户也能从中受益,少走弯路、节省成本,真正做到多快好省!
COTS器件通常既包含不适合高可靠应用的器件,也包括适合高可靠应用的器件,将其泛泛视为“低可靠”或者“低等级”,可能也就忽略了存在完全适合高可靠应用的重要COTS子集的事实。
这是NASA近两年对COTS实际应用的切身体会得来的经验升级。
比如车规级芯片(ACE-Q),由于厂商已经投入更多的质量控制和可靠性保障,因此可以不需要额外测试就可用于航天任务,满足任务环境(M)、应用场景(I)和使用寿命(L)要求。
如何保障航天任务安全与降低成本之间取得平衡,提升任务开发效率,同时减少成本和风险。
元器件级别的辐射测试(Part-Level Radiation Testing)花费昂贵,对小型空间任务是严重负担,单粒子效应(SEE)划分为五个等级,除了载人任务等S1类强制要求辐照测试外,其它的可以通过功能板级测试来满足要求。
这对国产FPGA厂商是重大利好。
包括重新定义的“业界领先厂商(Industry Leading Parts Manufacturer, ILPM)”,包括出货量大于1M,对生产环节采用稳定统计过程控制、高良率保障,能够提供每百万件缺陷数(DPPM)、器件失效率(FIT),以及AEC-Q车规质量认证等。
目前四家上市公司的FPGA,都符合“业界领先厂商”的成熟COTS器件定义。
紫光国微、复旦微电,以及成都华微,原先就有宇航级/军用级的厂商,则是“扩展了”应用范围。
而对于安路科技,以及启动IPO进程的紫光同创,连同已完成股改的高云半导体、京微齐力等公司在内,要么出货量够大,或者直接有工业级/车规级芯片,相当于不用专门设计抗辐芯片,就“顺势”拿到商业航天,特别是低轨卫星的入场券。
今年3月份,欧空局(ESA)的年度FPGA讨论会,开篇就是“尽管几大厂商的应用设计流程类似,但大家各有各的挑战”。虽然宇航级FPGA仍然不可替代,但包括SRAM FPGA在内,特别是COTS芯片,在新型航天应用场合快速增长。
全文完,感谢您的耐心阅读。