掌桥专利:专业的专利平台
掌桥专利
首页

自动驾驶车辆中视频压缩的时间戳和元数据处理

文献发布时间:2023-06-19 09:29:07


自动驾驶车辆中视频压缩的时间戳和元数据处理

技术领域

本公开的实施方式总体涉及操作自动驾驶车辆。更具体地,本公开的实施方式涉及用于自动驾驶车辆(ADV)的视频流的后处理。

背景技术

以自动驾驶模式运行(例如,无人驾驶)的车辆可以将乘员、尤其是驾驶员从一些驾驶相关的职责中解放出来。当以自动驾驶模式运行时,车辆可以使用车载传感器导航到各个位置,从而允许车辆在最少人机交互的情况下或在没有任何乘客的一些情况下行驶。

运动规划和控制是自动驾驶中的关键操作。运动规划和控制操作的准确性和效率在很大程度上依赖车辆的传感器。具体地,使用相机来捕获车辆周围场景的图像和视频,从而进行运动规划和控制。基于标准的图像和视频压缩算法用于压缩通过相机捕获的大量图像或视频数据。然而,视频压缩算法是为娱乐系统构建的,以方便用户观看,并不支持用于ADV中运行的机器感知过程的视频后处理。对视频压缩标准进行扩展以支持ADV应用程序所需的功能很复杂,并且普遍不受支持。需要一种简单且有效的机制来支持对用于ADV应用程序的捕获的视频数据进行后处理。

发明内容

在本公开的一方面,提供了一种用于操作自动驾驶车辆(ADV)的方法。该方法包括:从安装在所述ADV上的一个或多个相机接收图像数据的多个帧;将元数据附加至所述图像数据的帧中的每个,以生成未压缩图像数据的多个帧中的一个;从所述未压缩图像数据的多个帧中的每个中提取所述元数据,以生成已处理图像数据的多个帧中的一个;压缩所述已处理图像数据的多个帧中的每个,以生成压缩图像数据的多个帧中的一个;以及将所述元数据重新附加至所述压缩图像数据的多个帧中的相应一个,以生成多个压缩图像帧中的一个,其中,所述压缩图像帧被用于感知所述ADV周围的驾驶环境。

在本公开的另一方面,提供了一种自动驾驶车辆(ADV)的传感器单元。传感器单元包括:传感器接口,用于从安装在所述ADV上的一个或多个相机接收图像数据的多个帧;预处理模块,用于将元数据附加至所述图像数据的帧中的每个,以生成未压缩图像数据的多个帧中的一个;处理器,用于从所述未压缩图像数据的多个帧中的每个中提取所述元数据,以生成已处理图像数据的多个帧中的一个;以及视频编解码器,用于压缩所述已处理图像数据的多个帧中的每个,以生成压缩图像数据的多个帧中的一个,其中,所述处理器配置为将所述元数据重新附加至所述压缩图像数据的多个帧中的相应一个,以生成多个压缩图像帧中的一个,其中,所述压缩图像帧被用于感知所述ADV周围的驾驶环境。

在本公开的另一方面,提供了一种自动驾驶系统。该系统包括多个传感器以感测自动驾驶车辆(ADV)周围的驾驶环境,所述多个传感器包括一个或多个相机;感知与规划系统,用于规划路径并根据所述路径控制所述ADV,以导航所述驾驶环境;以及传感器单元,其中,所述传感器单元包括:传感器接口,用于从所述相机接收图像数据的多个帧;预处理模块,用于将元数据附加至所述图像数据的帧中的每个,以生成未压缩图像数据的多个帧中的一个;处理器,用于从所述未压缩图像数据的多个帧中的每个中提取所述元数据,以生成已处理图像数据的多个帧中的一个;以及视频编解码器,用于压缩所述已处理图像数据的多个帧中的每个,以生成压缩图像数据的多个帧中的一个,其中,所述处理器配置为将所述元数据重新附加至所述压缩图像数据的多个帧中的相应一个,以生成多个压缩图像帧中的一个,其中,所述压缩图像帧被用于感知所述ADV周围的驾驶环境。

附图说明

本公开的实施方式在附图的各图中以举例而非限制的方式示出,附图中的相同参考数字指示相同元件。

图1是示出根据一个实施方式的网络化系统的框图。

图2是示出一个实施方式的自动驾驶车辆的示例的框图。

图3A至图3B是示出根据一些实施方式的由自动驾驶车辆使用的感知与规划系统的示例的框图。

图4是示出根据一个实施方式的自动驾驶系统的架构的框图。

图5是示出根据一个实施方式的传感器单元的示例的框图。

图6是示出根据一个实施方式的视频压缩系统的示例的框图。

图7是示出根据一个实施方式的包含由视频压缩系统附加的元数据和图像数据的图像帧的图。

图8是示出根据一个实施方式的附加至图像帧的图像数据的元数据的示例的图。

图9是示出根据一个实施方式的视频处理方法的流程图。

图10是示出根据一个实施方式的数据处理系统的框图。

具体实施方式

以下将参考所讨论的细节来描述本公开的各种实施方式和方面,附图将示出各个实施方式。下列描述和附图是对本公开的说明,而不应当解释为限制本公开。描述了许多特定细节以提供对本公开各种实施方式的全面理解。然而,在某些情况下,并未描述众所周知的或常规的细节以提供对本公开的实施方式的简洁讨论。

本说明书中对“一个实施方式”或“实施方式”的提及意味着结合该实施方式所描述的特定特征、结构或特性可以包括在本公开的至少一个实施方式中。短语“在一个实施方式中”在本说明书中各个地方的出现不必全部指同一实施方式。

根据一个方面,执行传感器数据处理方法来操作ADV。响应于从安装在ADV上的多个相机接收的图像数据的多个帧,将元数据(例如时间戳)附接或附加至图像数据的每个帧,以在接收到图像数据时生成未压缩图像数据的多个帧中的一个,例如,作为压缩预处理的部分。在稍后压缩图像数据之前,作为流水线处理,从未压缩图像数据的每个帧中提取元数据,以生成已处理图像数据的多个帧中的一个。然后,例如使用常规视频编解码器,利用提取的元数据对已处理的图像数据的每个帧进行压缩,以生成压缩图像数据的多个帧中的一个。然后,将元数据重新附加至压缩图像数据的相应帧,以生成多个压缩图像帧中的一个。

根据另一方面,ADV的传感器单元包括:传感器接口,用于从安装在ADV上的一个或多个相机接收图像数据的帧;预处理模块,用于将元数据附加至图像数据的帧中的每个,以生成未压缩图像数据的多个帧中的一个;处理器,用于从未压缩图像数据的帧中的每个提取元数据,以生成已处理图像数据的多个帧中的一个;以及视频编解码器,用于压缩已处理图像数据的帧中的每个,以生成压缩图像数据的多个帧中的一个。处理器配置为将元数据重新附加至压缩图像数据的帧中的相应一个,以生成多个压缩图像帧中的一个,其中,利用压缩图像帧来感知ADV周围的驾驶环境。

根据另一方面,自动驾驶系统包括多个传感器,该多个传感器可安装在ADV上以感测ADV周围的驾驶环境并包括一个或多个相机;感知与规划系统,用于感知驾驶环境并规划路径以控制ADV来导航驾驶环境。传感器单元包括如上所述的组件。

图1是示出根据本公开的一个实施方式的自动驾驶车辆网络配置的框图。参考图1,网络配置100包括可以通过网络102通信地联接到一个或多个服务器103至104的自动驾驶车辆101。尽管示出一个自动驾驶车辆,但多个自动驾驶车辆可以通过网络102联接到彼此和/或联接到服务器103至104。网络102可以是任何类型的网络,例如,有线或无线的局域网(LAN)、诸如互联网的广域网(WAN)、蜂窝网络、卫星网络或其组合。服务器103至104可以是任何类型的服务器或服务器群集,诸如,网络或云服务器、应用服务器、后端服务器或其组合。服务器103至104可以是数据分析服务器、内容服务器、交通信息服务器、地图和兴趣点(MPOI)服务器或者位置服务器等。

自动驾驶车辆是指可以被配置成处于自动驾驶模式下的车辆,在所述自动驾驶模式下车辆在极少或没有来自驾驶员的输入的情况下导航通过环境。这种自动驾驶车辆可以包括传感器系统,所述传感器系统具有被配置成检测与车辆运行环境有关的信息的一个或多个传感器。所述车辆和其相关联的控制器使用所检测的信息来导航通过所述环境。自动驾驶车辆101可以在手动模式下、在全自动驾驶模式下或者在部分自动驾驶模式下运行。

在一个实施方式中,自动驾驶车辆101包括,但不限于,感知与规划系统110、车辆控制系统111、无线通信系统112、用户接口系统113和传感器系统115。自动驾驶车辆101还可以包括普通车辆中包括的某些常用部件,诸如:发动机、车轮、方向盘、变速器等,所述部件可以由车辆控制系统111和/或感知与规划系统110使用多种通信信号和/或命令进行控制,该多种通信信号和/或命令例如,加速信号或命令、减速信号或命令、转向信号或命令、制动信号或命令等。

部件110至115可以经由互连件、总线、网络或其组合通信地联接到彼此。例如,部件110至115可以经由控制器局域网(CAN)总线通信地联接到彼此。CAN总线是被设计成允许微控制器和装置在没有主机的应用中与彼此通信的车辆总线标准。它是最初是为汽车内的复用电气布线设计的基于消息的协议,但也用于许多其它环境。

现在参考图2,在一个实施方式中,传感器系统115包括但不限于一个或多个摄像机211、全球定位系统(GPS)单元212、惯性测量单元(IMU)213、雷达单元214以及光探测和测距(LIDAR)单元215。GPS系统212可以包括收发器,所述收发器可操作以提供关于自动驾驶车辆的位置的信息。IMU单元213可以基于惯性加速度来感测自动驾驶车辆的位置和定向变化。雷达单元214可以表示利用无线电信号来感测自动驾驶车辆的本地环境内的对象的系统。在一些实施方式中,除感测对象之外,雷达单元214可以另外感测对象的速度和/或前进方向。LIDAR单元215可以使用激光来感测自动驾驶车辆所处环境中的对象。除其它系统部件之外,LIDAR单元215还可以包括一个或多个激光源、激光扫描器以及一个或多个检测器。摄像机211可以包括用来采集自动驾驶车辆周围环境的图像的一个或多个装置。摄像机211可以是静物摄像机和/或视频摄像机。摄像机可以是可机械地移动的,例如,通过将摄像机安装在旋转和/或倾斜平台上。

传感器系统115还可以包括其它传感器,诸如:声纳传感器、红外传感器、转向传感器、油门传感器、制动传感器以及音频传感器(例如,麦克风)。音频传感器可以被配置成从自动驾驶车辆周围的环境中采集声音。转向传感器可以被配置成感测方向盘、车辆的车轮或其组合的转向角度。油门传感器和制动传感器分别感测车辆的油门位置和制动位置。在一些情形下,油门传感器和制动传感器可以集成为集成式油门/制动传感器。

在一个实施方式中,车辆控制系统111包括但不限于转向单元201、油门单元202(也被称为加速单元)和制动单元203。转向单元201用来调整车辆的方向或前进方向。油门单元202用来控制电动机或发动机的速度,电动机或发动机的速度进而控制车辆的速度和加速度。制动单元203通过提供摩擦使车辆的车轮或轮胎减速而使车辆减速。应注意,如图2所示的部件可以以硬件、软件或其组合实施。

回到图1,无线通信系统112允许自动驾驶车辆101与诸如装置、传感器、其它车辆等外部系统之间的通信。例如,无线通信系统112可以与一个或多个装置直接无线通信,或者经由通信网络进行无线通信,诸如,通过网络102与服务器103至104通信。无线通信系统112可以使用任何蜂窝通信网络或无线局域网(WLAN),例如,使用WiFi,以与另一部件或系统通信。无线通信系统112可以例如使用红外链路、蓝牙等与装置(例如,乘客的移动装置、显示装置、车辆101内的扬声器)直接通信。用户接口系统113可以是在车辆101内实施的外围装置的部分,包括例如关键字、触摸屏显示装置、麦克风和扬声器等。

自动驾驶车辆101的功能中的一些或全部可以由感知与规划系统110控制或管理,尤其当在自动驾驶模式下操作时。感知与规划系统110包括必要的硬件(例如,处理器、存储器、存储设备)和软件(例如,操作系统、规划和路线安排程序),以从传感器系统115、控制系统111、无线通信系统112和/或用户接口系统113接收信息,处理所接收的信息,规划从起始点到目的地点的路线或路径,随后基于规划和控制信息来驾驶车辆101。替代地,感知与规划系统110可以与车辆控制系统111集成在一起。

例如,作为乘客的用户可以例如经由用户接口来指定行程的起始位置和目的地。感知与规划系统110获得行程相关数据。例如,感知与规划系统110可以从MPOI服务器中获得位置和路线信息,所述MPOI服务器可以是服务器103至104的一部分。位置服务器提供位置服务,并且MPOI服务器提供地图服务和某些位置的POI。替代地,此类位置和MPOI信息可以本地高速缓存在感知与规划系统110的永久性存储装置中。

当自动驾驶车辆101沿着路线移动时,感知与规划系统110也可以从交通信息系统或服务器(TIS)获得实时交通信息。应注意,服务器103至104可以由第三方实体进行操作。替代地,服务器103至104的功能可以与感知与规划系统110集成在一起。基于实时交通信息、MPOI信息和位置信息以及由传感器系统115检测或感测的实时本地环境数据(例如,障碍物、对象、附近车辆),感知与规划系统110可以规划最佳路线并且根据所规划的路线例如经由控制系统111来驾驶车辆101,以安全且高效到达指定目的地。

服务器103可以是为各种客户端执行数据分析服务的数据分析系统。在一个实施方式中,数据分析系统103包括数据收集器121和机器学习引擎122。数据收集器121从各种车辆收集驾驶统计数据123,这些车辆可以是自动驾驶车辆,也可以是人类驾驶员驾驶的常规车辆。驾驶统计数据123包括指示所发出的驾驶命令(例如,油门、制动器、转向命令)以及在不同的时间点由车辆的传感器捕获的车辆的响应(例如,速度、加速度、减速度、方向)的信息。驾驶统计数据123还可包括描述不同时间点的驾驶环境的信息,例如路线(包括起点和目的地位置)、MPOI、道路状况、天气状况等。

基于驾驶统计数据123,机器学习引擎122生成或训练用于各种目的的一组规则、算法和/或预测模型124。在一个实施方式中,算法124可包括用于感知、预测、决定、规划和/或控制过程的规则或算法,这将在下面进一步详细描述。然后,可将算法124上传到ADV上,以在自动驾驶过程中实时使用。

在一个实施方式中,算法124可包括视频处理算法,该视频处理算法从相机211接收视频数据的帧。视频处理算法可将元数据附加至接收到的视频数据的每一个帧,从而生成视频帧。来自多个相机的大量视频帧可存储在存储器中。为了压缩视频帧,视频处理算法可从存储器读取视频帧,并且可从视频帧提取元数据。没有元数据的视频数据可由视频编码器压缩,以生成压缩的视频数据。视频处理算法可将元数据附加回压缩视频数据,以生成包含压缩视频数据和元数据的压缩视频帧。压缩视频帧可通过网络102发送至感知与规划系统110或服务器103,以进一步处理和分析图像。

图3A和图3B是示出根据一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。系统300可以被实施为图1的自动驾驶车辆101的一部分,包括但不限于感知与规划系统110、控制系统111和传感器系统115。参考图3A和图3B,感知与规划系统110包括但不限于定位模块301、感知模块302、预测模块303、决策模块304、规划模块305、控制模块306以及路线模块307。

模块301至307中的一些或全部可以在软件、硬件或其组合中实施。例如,这些模块可以安装在永久性存储装置352中、加载到存储器351中,并且由一个或多个处理器(未示出)执行。应注意,这些模块中的一些或全部可以通信地联接到图2的车辆控制系统111的一些或全部模块或者与它们集成在一起。模块301至307中的一些可以一起集成为集成模块。例如,决策模块304和规划模块305可集成为单个模块。

定位模块301确定自动驾驶车辆300的当前位置(例如利用GPS单元212),并管理与用户的行程或路线相关的任何数据。定位模块301(也被称为地图与路线模块)管理与用户的行程或路线相关的任何数据。用户可以例如经由用户接口登录并且指定行程的起始位置和目的地。定位模块301与自动驾驶车辆300的诸如地图和路线信息311的其它部件通信,以获得行程相关数据。例如,定位模块301可以从位置服务器和地图与POI(MPOI)服务器获得位置和路线信息。位置服务器提供位置服务,并且MPOI服务器提供地图服务和某些位置的POI,从而可以作为地图和路线信息311的一部分高速缓存。当自动驾驶车辆300沿着路线移动时,定位模块301也可以从交通信息系统或服务器获得实时交通信息。

基于由传感器系统115提供的传感器数据和由定位模块301获得的定位信息,感知模块302确定对周围环境的感知。感知信息可以表示普通驾驶员在驾驶员正驾驶的车辆周围将感知到的东西。感知可以包括例如采用对象形式的车道配置(例如,直线车道或弯曲车道)、交通灯信号、另一车辆的相对位置、行人、建筑物、人行横道或其它交通相关标志(例如,停止标志、让行标志)等。车道配置包括描述一个或多个车道的信息,例如,车道的形状(例如,笔直或曲率)、车道的宽度、道路中有多少个车道、单向或双向车道、合并或拆分车道、出口车道等。

感知模块302可以包括计算机视觉系统或计算机视觉系统的功能,以处理并分析由一个或多个摄像机采集的图像,从而识别自动驾驶车辆环境中的对象和/或特征。所述对象可以包括交通信号、道路边界、其它车辆、行人和/或障碍物等。计算机视觉系统可以使用对象识别算法、视频跟踪以及其它计算机视觉技术。在一些实施方式中,计算机视觉系统可以绘制环境地图,跟踪对象,以及估算对象的速度等。感知模块302也可以基于由诸如雷达和/或LIDAR的其它传感器提供的其它传感器数据来检测对象。

针对每个对象,预测模块303预测在各种情况下对象将表现出什么。基于感知数据来中预测,该感知数据在时间点上考虑到一组地图/路线信息311和交通规则312来感知驾驶环境。例如,如果对象是在相反方向的车辆,并且当前驾驶环境包括交叉路口,则预测模块303将预测该车辆可能是直线行驶还是转弯。如果感知数据指示交叉路口没有交通灯,则预测模块303可预测车辆可能必须在进入交叉路口之前完全停止。如果感知数据指示车辆当前处于仅左转车道或仅右转车道,则预测模块303可预测车辆将更可能分别左转或右转。

针对每个对象,决策模块304作出关于如何处置对象的决策。例如,针对特定对象(例如,交叉路线中的另一车辆)以及描述对象的元数据(例如,速度、方向、转弯角度),决策模块304决定如何遇到所述对象(例如,超车、让路、停止、超过)。决策模块304可以根据诸如交通规则或驾驶规则312的一套规则来做出此类决策,所述规则可存储在永久性存储装置352中。

路线模块307配置为提供从起点到目的地点的一条或多条路线或路径。对于例如从用户处接收到的、从起始位置到目的地位置的给定行程,路线模块307获得路线和地图信息311,并确定从起始位置到达目的地位置的所有可能的路线或路径。路线模块307可为其从起始位置到达目的地位置所确定的路线中的每条生成地形图形式的参考线。参考线是指理想的路线或路径,不受其他车辆、障碍物或交通状况等其他因素的干扰。也就是说,如果道路上没有其他车辆、行人或障碍物,则ADV应该准确或紧密跟随参考线。然后,将地形图提供给决策模块304和/或规划模块305。决策模块304和/或规划模块305根据由其他模块提供的其他数据,检查所有可能的路线,从而选择和修改最佳路线中的一个,其中,其他数据诸如为来自定位模块301的交通状况、感知模块302感知的驾驶环境以及预测模块303预测的交通状况。用于控制ADV的实际路径或路线可能取决于时间点上的具体驾驶环境而与路线模块307提供的参考线接近或不同。

基于针对所感知到的对象中的每个的决定,规划模块305为自动驾驶车辆规划路径或路线以及驾驶参数(例如,距离、速度和/或转弯角度)。换言之,针对给定的对象,决策模块304决定对该对象做什么,而规划模块305确定如何去做。例如,针对给定的对象,决策模块304可以决定超过所述对象,而规划模块305可以确定在所述对象的左侧还是右侧超过。规划和控制数据由规划模块305生成,包括描述车辆300在下一移动循环(例如,下一路线/路径段)中将如何移动的信息。例如,规划和控制数据可以指示车辆300以30英里每小时(mph)的速度移动10米,随后以25mph的速度变到右侧车道。

基于规划和控制数据,控制模块306根据由规划和控制数据限定的路线或路径通过将适当的命令或信号发送至车辆控制系统111来控制并驾驶自动驾驶车辆。所述规划和控制数据包括足够的信息,以沿着路径或路线在不同的时间点使用适当的车辆设置或驾驶参数(例如,油门、制动和转弯命令)将车辆从路线或路径的第一点驾驶到第二点。

在一个实施方式中,在多个规划周期中执行规划阶段,例如,在每个100毫秒(ms)的时间间隔中,规划周期也称为命令周期。针对每个规划周期或命令周期,将基于规划和控制数据发出一个或多个控制命令。也就是说,对于每100ms,规划模块305规划下一路线段或路径段,例如,包括目标位置和ADV到达目标位置所需的时间。替代地,规划模块305可进一步指定具体速度、方向和/或转向角等。在一个实施方式中,规划模块305规划诸如5秒的下一预定时间段的路线段或路径段。针对每个规划周期,规划模块305基于在先前周期中规划的目标位置来规划当前周期的目标位置(例如,接下来的5秒)。然后,控制模块306基于当前周期的规划和控制数据来生成一个或多个控制命令(例如,油门、制动、转向控制命令)。

应注意,决策模块304和规划模块305可以集成为集成模块。决策模块304/规划模块305可以包括导航系统或导航系统的功能,以确定自动驾驶车辆的驾驶路径。例如,导航系统可以确定用于实现自动驾驶车辆沿着以下路径移动的一系列速度和定向前进方向:所述路径在使自动驾驶车辆沿着通往最终目的地的基于车行道的路径前进的同时,基本上避免感知到的障碍物。目的地可以根据经由用户接口系统113进行的用户输入来设定。导航系统可以在自动驾驶车辆正在运行的同时动态地更新驾驶路径。导航系统可以将来自GPS系统和一个或多个地图的数据合并,以确定用于自动驾驶车辆的驾驶路径。

应注意,如上文示出和描述的部件中的一些或全部可以在软件、硬件或其组合中实施。例如,此类部件可以实施为安装并存储在永久性存储装置中的软件,所述软件可以通过处理器(未示出)加载在存储器中并在存储器中执行以实施贯穿本申请所述的过程或操作。替代地,此类部件可以实施为编程或嵌入到专用硬件(诸如,集成电路(例如,专用集成电路或ASIC)、数字信号处理器(DSP)或现场可编程门阵列(FPGA))中的可执行代码,所述可执行代码可以经由来自应用的相应驱动程序和/或操作系统来访问。此外,此类部件可以实施为处理器或处理器内核中的特定硬件逻辑,作为可由软件部件通过一个或多个特定指令访问的指令集的一部分。

图4是示出根据一个实施方式的用于自动驾驶的系统架构的框图。系统架构400可表示如图3A和图3B所示的自动驾驶系统的系统架构。参照图4,系统架构400包括但不限于应用层401、规划和控制(PNC)层402、感知层403、驱动器层404、固件层405和硬件层406。应用层401可包括与自动驾驶车辆的用户或乘客交互的用户界面或配置应用,例如与用户界面系统113相关联的功能。PNC层402可至少包括规划模块305和控制模块306的功能。感知层403可包括至少感知模块302的功能。在一个实施方式中,存在包括预测模块303和/或决策模块304的功能的附加层。替换地,这样的功能可包括于PNC层402和/或感知层403中。系统架构400进一步包括驱动器层404、固件层405和硬件层406。固件层405可至少表示传感器系统115的功能,其可以以现场可编程门阵列(FPGA)的形式实现。硬件层406可表示自动驾驶车辆的硬件,诸如控制系统111。层401至层403可经由设备驱动器层404与固件层405和硬件层406通信。

图5是示出根据本公开的一个实施方式的传感器系统的示例的框图。参照图5,传感器系统115包括联接至主机系统110的传感器单元500和多个传感器510。主机系统110表示如上所述的规划和控制系统,其可以包括如图3A和图3B所示的模块中的至少一些。传感器单元500可以以FPGA设备或ASIC(专用集成电路)设备的形式实现。在一个实施方式中,传感器单元500除其他外还包括一个或多个传感器数据处理模块501(也简称为传感器处理模块)、数据传输模块502和传感器控制模块或逻辑503。模块501至模块503可经由传感器接口504与传感器510通信,并经由主机接口505与主机系统110通信。可选地,内部或外部缓存器506可用于缓存数据以进行处理。

在一个实施方式中,对于接收路径或上游方向,传感器处理模块501配置为经由传感器接口504从传感器接收传感器数据,并处理传感器数据(例如,格式转换、错误检查),这可临时存储在缓存器506中。数据传输模块502配置为使用与主机接口505兼容的通信协议将已处理的数据传输至主机系统110。类似地,对于传输路径或下游方向,数据传输模块502配置为从主机系统110接收数据或命令。然后,通过传感器处理模块501将数据处理为与相应传感器兼容的格式。然后,将已处理的数据传输至传感器。

在一个实施方式中,传感器控制模块或逻辑503配置为响应于通过主机接口505从主机系统(例如,感知模块302)接收的命令来控制传感器510的某些操作,例如,激活捕获传感器数据的定时。主机系统110可将传感器510配置为以协作和/或同步的方式捕获传感器数据,使得可在任何时间点利用传感器数据来感知车辆周围的驾驶环境。

传感器接口504可包括以太网、USB(通用串行总线)、LTE(长期演进)或蜂窝、WiFi、GPS、相机、CAN、串行(例如,通用异步接收发送器或UART)、SIM(用户识别模块)卡和其他通用输入/输出(GPIO)接口中的一种或多种。主机接口505可以是任何高速或高带宽接口,诸如PCIe(外围组件互连或PCI Express)接口。传感器510可包括在自动驾驶车辆中使用的各种传感器,例如相机、LIDAR设备、RADAR设备、GPS接收器、IMU、超声传感器、GNSS(全球导航卫星系统)接收器、LTE或蜂窝SIM卡、车辆传感器(例如油门、制动、转向传感器)和系统传感器(例如温度、湿度、压力传感器)等。

例如,相机可经由以太网或GPIO接口联接。GPS传感器可经由USB或特定的GPS接口联接。车辆传感器可通过CAN接口联接。RADAR传感器或超声波传感器可通过GPIO接口联接。LIDAR设备可通过以太网接口联接。外部SIM模块可通过LTE接口联接。类似地,可将内部SIM模块插入传感器单元500的SIM插槽中。诸如UART的串行接口可与控制台系统联接以进行调试。

应注意的是,传感器510可以是任何种类的传感器,并且可由各种供应商或供货商提供。传感器处理模块501配置为处理不同类型的传感器及其各自的数据格式和通信协议。根据一个实施方式,传感器510中的每个均与特定通道相关联,该特定通道用于处理传感器数据并在主机系统110与相应的传感器之间传输已处理的传感器数据。每个通道均包括已配置或编程为处理相应传感器数据和协议的特定传感器处理模块和特定数据传输模块。

图6是示出根据一个实施方式的视频压缩系统610的示例的框图。视频压缩系统610表示图5的传感器系统115的一个实施方式,其中传感器是配置为捕获ADV周围的场景的一个或多个相机211。相机211可以是静态相机和/或视频相机。相机211中的每个均可与用于提供ADV周围环境的图像或视频流的通道相关联。尽管下面的讨论将通道数据称为视频数据,并将在通道数据上执行的操作称为视频压缩或视频处理,但应理解的是,通道数据还可以表示由静态相机捕获的图像数据,以及所执行的操作可以是图像处理或图像压缩。

视频处理单元500对从相机211接收的多个视频数据流执行视频后处理。视频后处理操作可包括视频数据的时间戳标记、视频压缩、数据和通道同步、错误处理和恢复等。视频处理单元500可包括相机接口601、压缩预处理模块603、处理器605、视频编解码器607、主机接口505和网络接口611。在一个实施方式中,视频处理单元500可以以FPGA或ASIC实现。

在另一实施方式中,视频处理单元500的一个或多个模块,诸如相机接口601、压缩预处理模块603、视频编解码器607和网络接口611可在FPGA或ASIC中实现。相机接口601配置为从相机211接收视频数据流,并且可包括以太网、USB、LTE或蜂窝、WiFi、串行(例如,UART)和其他GPIO接口中的一种或多种。以与视频相机的帧速率相对应的速率将视频数据作为帧接收。视频数据的每个帧均可包括标题数据,其后是原始图像数据和页脚数据。标题数据或页脚数据可包含与捕获原始图像数据的相机211中的给定一个的特征有关的信息,或者可包含与原始图像数据有关的信息。

压缩预处理模块603配置为在视频编码之前处理视频数据。由于可能同时存在从相机211接收的多个通道的视频数据,因而压缩预处理模块603可将元数据添加至视频数据的每个帧中,以进行时间同步、通道差异化、错误处理等。在一个实施方式中,压缩预处理模块603可替换或修改页脚数据以容纳添加的元数据。

图7是示出根据一个实施方式的图像帧700的视图,图像帧700包括来自视频相机的图像数据的帧和由视频压缩系统610附加的元数据。图像帧700包括标题数据703、图像数据705、页脚数据707和元数据709。标题数据703和页脚数据707封装图像数据的帧,并从捕获图像数据的相机接收图像数据,以包括关于视频相机或图像数据的信息。在一个实施方式中,压缩预处理模块603可替换或修改页脚数据。元数据709由预处理模块603添加,以基于用户定义的信息通道提供同步和错误处理能力。在一个实施方式中,元数据可以是软件可配置的。

图8是示出根据一个实施方式的、附加至图像帧的图像数据的元数据的示例的图。元数据709包括用于序号803、时间戳805、错误代码807和通道号809的字段。这些字段、字段的数量及其各自的长度可以是软件可配置的。序号803可标记至图像帧,以指示从相机接收的图像帧的顺序。时间戳805可标记至图像帧,以指示接收图像帧的时间。通道号809可标记至图像帧,以指示提供图像帧的相机或通道。序号803、时间戳805和通道号809可由ADV或服务器使用,以同步多个视频数据流。错误代码807可用于错误处理。视频处理单元500的预处理模块603或处理器605可在图像帧的后处理期间生成错误代码807。在一个实施方式中,错误代码807可指示相机错误、沿着处理链的数据缓存器的内部缓存器错误、乱序图像帧和恢复、多个通道之间的同步错误和恢复等。在一个实施方式中,元数据709可包括用于元数据709的完整性检查的奇偶校验码或纠错码。

再次参考图6,压缩预处理模块603可将包括附加元数据的图像帧存储至存储器609。存储器609可包括一个或多个易失性存储(或存储器)设备,诸如随机存取存储器(RAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双倍数据速率(DDR)DRAM、静态RAM(SRAM)或其他类型的非易失性固态、光学或磁性存储设备。在一个实施方式中,压缩预处理模块603可包括行缓存器,以缓存图像帧的一或多行数据。当行缓存器被填充时,压缩预处理模块603可执行对存储器609的直接存储器访问(DMA),以存储包括标题数据、原始图像数据、页脚数据和元数据的行缓存器数据。存储器609可存储已由压缩预处理模块603处理过的、从相机211的多个通道流传输的视频数据的帧。存储器609还可包括由处理器605执行的软件,以执行视频处理单元500的各种后处理功能。

例如,为了减少图像帧的存储空间,处理器605可从存储器609读取图像帧,或可从压缩预处理模块603接收图像帧,从而在将图像帧发送至视频编解码器607以进行视频压缩之前提取元数据。在一个实施方式中,处理器605可提取并重新格式化标题数据、页脚数据和元数据,并且可将图像帧的原始图像数据发送至视频编解码器607。视频编解码器607可使用H.264、H.265或其他行业标准对图像数据的帧执行视频压缩。视频编解码器607可以以硬件、软件或硬件和软件的组合来实现。处理器605可从视频编解码器607接收回经压缩的视频的帧,并且可将元数据重新附加至经压缩的视频,以重构现在包括经压缩的视频的图像帧。在一个实施方式中,处理器605可将标题数据和页脚数据重新附加至经压缩的视频帧。在一个实施方式中,处理器605可在将元数据、标题数据或页脚数据重新附加至经压缩的视频帧之前将元数据、标题数据或页脚数据重新格式化。

处理器605可使用与主机接口505兼容的通信协议将压缩的视频帧传输至主机系统110。主机接口505可以是诸如PCIe接口的任何高速或高带宽接口。主机系统110可表示所讨论的感知与规划系统110或控制系统111。在一个实施方式中,处理器605可通过网络接口611将压缩的视频帧传送至数据网络613。数据网络613可表示ADV、大容量存储设备或服务器103或104的其他系统。网络接口611可为任何有线或无线的通讯接口。在一个实施方式中,处理器605可配置为在访问来自存储器609的未经压缩的视频帧时、从未经压缩的视频帧提取元数据时、将未经压缩的视频帧发送至视频编解码器607时、从视频编解码器607接收压缩视频帧时、重新附加元数据时、以及将压缩视频帧发送至主机系统110和数据网络613时,执行缓存器管理功能。

图9是示出根据一个实施方式的视频处理方法的流程图。视频处理方法900可由处理逻辑来执行,该处理逻辑可包括软件、硬件或其组合。例如,路径规划方法900可由图6的视频处理单元500的处理器605或压缩预处理模块603来执行。在方框901,视频处理方法900从视频相机接收图像数据。图像数据可作为视频数据的帧进行接收,其中,每个视频帧均包括标题数据、原始图像数据和页脚数据。

在方框907,视频处理方法900将元数据附加至每个视频帧,以生成包括附加的元数据的未压缩图像帧。元数据被添加至视频帧,以提供同步和错误处理功能。元数据可包括时间戳、序号、通道号和错误代码的软件可配置字段。来自相机的多个通道的未压缩图像帧可存储在存储器中。

在方框915,视频处理方法900在发送未压缩图像数据以进行视频压缩之前,从每个未压缩图像帧中提取元数据。视频处理方法900可从存储器读取每个未压缩图像帧,提取并重新格式化元数据,以及将具有提取的元数据的未压缩图像帧发送至视频编解码器,具有提取的元数据的未压缩图像帧被称为已处理的图像数据的帧。在一个实施方式中,视频处理方法900可从未压缩图像帧提取标题数据和页脚数据,并且可将原始图像数据的帧发送至视频编解码器。

在方框919,视频处理方法900利用提取的元数据来压缩每个未压缩图像帧,以生成压缩视频的帧。在一个实施方式中,视频处理方法900压缩原始图像数据的每个帧,以生成压缩视频的帧。在923,视频处理方法900将元数据重新附加至压缩视频的相应帧,以重构现在包括压缩视频的图像帧。在视频压缩之前,可根据未压缩图像帧中的元数据重新格式化压缩视频帧中的元数据。通过将元数据附加至从多个相机接收的流视频数据的帧、在视频压缩之前从每个帧中提取元数据、以及将元数据重新附加至压缩视频以重构压缩视频的帧,处理方法900提供了简单且有效的机制来支持捕获的视频数据的后处理,诸如时间同步和错误处理。

图10是示出可与本公开的一个实施方式一起使用的数据处理系统的示例的框图。例如,系统1000可以表示以上所述的执行上述过程或方法中的任一个的任何数据处理系统,例如,图3A和图3B的包括决策模块304、规划模块305的感知与规划系统110、图6的视频压缩系统610或图1的服务器103至104中的任一个。系统1000可以包括许多不同的部件。这些部件可以实施为集成电路(IC)、集成电路的部分、分立电子装置或适用于电路板的其他模块(诸如,计算机系统的主板或插入卡)或者实施为以其他方式并入计算机系统的机架内的部件。

还应注意,系统1000旨在示出计算机系统的许多部件的高级视图。然而,应当理解,某些实施方式中可以具有附加的部件,此外,其他实施方式中可以具有所示部件的不同配置。系统1000可以表示台式计算机、膝上型计算机、平板计算机、服务器、移动电话、媒体播放器、个人数字助理(PDA)、智能手表、个人通信器、游戏装置、网络路由器或集线器、无线接入点(AP)或中继器、机顶盒或其组合。此外,虽然仅示出了单个机器或系统,但是术语“机器”或“系统”还应当被理解为包括单独地或共同地执行一个(或多个)指令集以执行本文所讨论的任何一种或多种方法的机器或系统的任何集合。

在一个实施方式中,系统1000包括通过总线或互连件1010连接的处理器1001、存储器1003以及装置1005至1008。处理器1001可以表示其中包括单个处理器内核或多个处理器内核的单个处理器或多个处理器。处理器1001可以表示一个或多个通用处理器,诸如,微处理器、中央处理单元(CPU)等。更具体地,处理器1001可为复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、或实施其他指令集的处理器、或实施指令集组合的处理器。处理器1001还可为一个或多个专用处理器,诸如,专用集成电路(ASIC)、蜂窝或基带处理器、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、网络处理器、图形处理器、通信处理器、加密处理器、协同处理器、嵌入式处理器,或者能够处理指令的任何其他类型的逻辑。

处理器1001可为低功率多核处理器接口,诸如超低电压处理器,处理器1001可以充当用于与所述系统的各种部件通信的主处理单元和中央集线器。这种处理器可以实施为片上系统(SoC)。处理器1001配置成执行用于执行本文所讨论的操作和步骤的指令。系统1000还可以包括与可选的图形子系统1004通信的图形接口,图形子系统1004可以包括显示控制器、图形处理器和/或显示装置。

处理器1001可以与存储器1003通信,存储器1003在一个实施方式中可以经由多个存储器装置实施以提供给定量的系统存储器。存储器1003可以包括一个或多个易失性存储(或存储器)装置,诸如,随机存取存储器(RAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、静态RAM(SRAM)或者其他类型的存储装置。存储器1003可以存储包括由处理器1001或任何其他装置执行的指令序列的信息。例如,各种操作系统、装置驱动程序、固件(例如,输入输出基本系统或BIOS)和/或应用的可执行代码和/或数据可以加载到存储器1003中并由处理器1001执行。操作系统可为任何类型的操作系统,例如,机器人操作系统(ROS)、来自

系统1000还可以包括IO装置,诸如装置1005至1008,包括网络接口装置1005、可选的输入装置1006,以及其他可选的IO装置1007。网络接口装置1005可以包括无线收发器和/或网络接口卡(NIC)。所述无线收发器可为WiFi收发器、红外收发器、蓝牙收发器、WiMax收发器、无线蜂窝电话收发器、卫星收发器(例如,全球定位系统(GPS)收发器)或其他射频(RF)收发器或者它们的组合。NIC可为以太网卡。

输入装置1006可包括鼠标、触摸板、触敏屏幕(其可以与显示装置1004集成在一起)、指针装置(诸如,指示笔)和/或键盘(例如,物理键盘或作为触敏屏幕的一部分显示的虚拟键盘)。例如,输入装置1006可以包括联接到触摸屏的触摸屏控制器。触摸屏和触摸屏控制器例如可以使用多种触敏技术(包括但不限于电容、电阻、红外和表面声波技术)中的任一种,以及用于确定与触摸屏接触的一个或多个接触点的其他接近传感器阵列或其他元件来检测其接触和移动或间断。

IO装置1007可以包括音频装置。音频装置可以包括扬声器和/或麦克风,以促进支持语音的功能,诸如语音识别、语音复制、数字记录和/或电话功能。其他IO装置1007还可以包括通用串行总线(USB)端口、并行端口、串行端口、打印机、网络接口、总线桥(例如,PCI-PCI桥)、传感器(例如,运动传感器,诸如加速度计、陀螺仪、磁强计、光传感器、罗盘、接近传感器等)或者它们的组合。装置1007还可以包括成像处理子系统(例如,相机),所述成像处理子系统可以包括用于促进相机功能(诸如,记录照片和视频片段)的光学传感器,诸如电荷耦合装置(CCD)或互补金属氧化物半导体(CMOS)光学传感器。某些传感器可以经由传感器集线器(未示出)联接到互连件1010,而诸如键盘或热传感器的其他装置可以根据系统1000的具体配置或设计由嵌入式控制器(未示出)控制。

为了提供诸如数据、应用、一个或多个操作系统等信息的永久性存储,大容量存储设备(未示出)也可以联接到处理器1001。在各种实施方式中,为了实现更薄且更轻的系统设计并且改进系统响应性,这种大容量存储设备可以经由固态装置(SSD)来实施。然而,在其他实施方式中,大容量存储设备可以主要使用硬盘驱动器(HDD)来实施,其中较小量的SSD存储设备充当SSD高速缓存以在断电事件期间实现上下文状态以及其他此类信息的非易失性存储,从而使得在系统活动重新启动时能够实现快速通电。另外,闪存装置可以例如经由串行外围接口(SPI)联接到处理器1001。这种闪存装置可以提供系统软件的非易失性存储,所述系统软件包括所述系统的BIOS以及其他固件。

存储装置1008可包括计算机可访问的存储介质1009(也被称为机器可读存储介质或计算机可读介质),其上存储有体现本文所述的任何一种或多种方法或功能的一个或多个指令集或软件(例如,模块、单元和/或逻辑1028)。处理模块/单元/逻辑1028可以表示上述部件中的任一个,例如诸如图3A和图3B中的决策模块304或规划模块305或图6的视频压缩系统610。处理模块/单元/逻辑1028还可以在其由数据处理系统1000、存储器1003和处理器1001执行期间完全地或至少部分地驻留在存储器1003内和/或处理器1001内,数据处理系统1000、存储器1003和处理器1001也构成机器可访问的存储介质。处理模块/单元/逻辑1028还可以通过网络经由网络接口装置1005进行传输或接收。

计算机可读存储介质1009也可以用来永久性地存储以上描述的一些软件功能。虽然计算机可读存储介质1009在示例性实施方式中被示为单个介质,但是术语“计算机可读存储介质”应当被认为包括存储所述一个或多个指令集的单个介质或多个介质(例如,集中式或分布式数据库和/或相关联的高速缓存和服务器)。术语“计算机可读存储介质”还应当被认为包括能够存储或编码指令集的任何介质,所述指令集用于由机器执行并且使得所述机器执行本公开的任何一种或多种方法。因此,术语“计算机可读存储介质”应当被认为包括但不限于固态存储器以及光学介质和磁性介质,或者任何其他非暂时性机器可读介质。

本文所述的处理模块/单元/逻辑1028、部件以及其他特征可以实施为分立硬件部件或集成在硬件部件(诸如,ASICS、FPGA、DSP或类似装置)的功能中。此外,处理模块/单元/逻辑1028可以实施为硬件装置内的固件或功能电路。此外,处理模块/单元/逻辑1028可以以硬件装置和软件部件的任何组合来实施。

应注意,虽然系统1000被示出为具有数据处理系统的各种部件,但是并不旨在表示使部件互连的任何特定架构或方式;因为此类细节和本公开的实施方式没有密切关系。还应当认识到,具有更少部件或可能具有更多部件的网络计算机、手持计算机、移动电话、服务器和/或其他数据处理系统也可以与本公开的实施方式一起使用。

前述详细描述中的一些部分已经根据在计算机存储器内对数据位的运算的算法和符号表示而呈现。这些算法描述和表示是数据处理领域中的技术人员所使用的方式,以将他们的工作实质最有效地传达给本领域中的其他技术人员。本文中,算法通常被认为是导致所期望结果的自洽操作序列。这些操作是指需要对物理量进行物理操控的操作。

然而,应当牢记,所有这些和类似的术语均旨在与适当的物理量关联,并且仅仅是应用于这些量的方便标记。除非在以上讨论中以其他方式明确地指出,否则应当了解,在整个说明书中,利用术语(诸如所附权利要求书中所阐述的术语)进行的讨论是指计算机系统或类似电子计算装置的动作和处理,所述计算机系统或电子计算装置操控计算机系统的寄存器和存储器内的表示为物理(电子)量的数据,并将所述数据变换成计算机系统存储器或寄存器或者其他此类信息存储设备、传输或显示装置内类似地表示为物理量的其他数据。

本公开的实施方式还涉及用于执行本文中的操作的设备。这种计算机程序被存储在非暂时性计算机可读介质中。机器可读介质包括用于以机器(例如,计算机)可读的形式存储信息的任何机构。例如,机器可读(例如,计算机可读)介质包括机器(例如,计算机)可读存储介质(例如,只读存储器(“ROM”)、随机存取存储器(“RAM”)、磁盘存储介质、光存储介质、闪存存储器装置)。

前述附图中所描绘的过程或方法可以由处理逻辑来执行,所述处理逻辑包括硬件(例如,电路、专用逻辑等)、软件(例如,体现在非暂时性计算机可读介质上)或两者的组合。尽管所述过程或方法在上文是依据一些顺序操作来描述的,但是应当了解,所述操作中的一些可以按不同的顺序执行。此外,一些操作可以并行地执行而不是顺序地执行。

本公开的实施方式并未参考任何特定的编程语言进行描述。应认识到,可以使用多种编程语言来实施如本文描述的本公开的实施方式的教导。

在以上的说明书中,已经参考本公开的具体示例性实施方式对本公开的实施方式进行了描述。将显而易见的是,在不脱离所附权利要求书中阐述的本公开的更宽泛精神和范围的情况下,可以对本公开做出各种修改。因此,应当在说明性意义而不是限制性意义上来理解本说明书和附图。

技术分类

06120112180970