序号 | 专利名 | 申请号 | 申请日 | 公开(公告)号 | 公开(公告)日 | 发明人 |
---|---|---|---|---|---|---|
161 | 一种跟踪方法及装置 | CN201910510134.0 | 2019-06-13 | CN111369587A | 2020-07-03 | 王科; 沈涛; 裴建军; 于建志; 张浩; 刘义; 陈延鸿 |
本发明实施例提供了一种跟踪方法及装置,方法包括:确定图像检测发生偏差的第一监控设备,获取第一监控设备拍摄到的目标重叠区域的视频图像中的第一跟踪坐标,及第二监控设备拍摄到的目标重叠区域的视频图像中与第一跟踪坐标的时间戳相同的第二跟踪坐标,将第二跟踪坐标对应的平面坐标作为第一跟踪坐标对应的平面坐标。根据第一跟踪坐标和第一跟踪坐标对应的平面坐标,确定第一监控设备的目标坐标转换矩阵。当获取到第一监控设备拍摄的目标跟踪对象的跟踪坐标时,根据目标坐标转换矩阵,确定目标跟踪对象的平面坐标。基于此,可以确定出视频图像出现偏差的第一监控设备,并校准第一监控设备的坐标转换矩阵,提高了跟踪对象的轨迹信息的准确率。 | ||||||
162 | 包括基于图像的拖车角度检测的自动摇摄相机监测系统 | CN202310653735.3 | 2023-06-05 | CN117183894A | 2023-12-08 | 马亮; 乌特卡什·夏尔马; 赛义夫·伊姆兰; 穆罕默德·古达尔齐; 阮潘; 魏文鹏 |
提供一种包括基于图像的拖车角度检测的自动摇摄相机监测系统。还提供一种用于自动摇摄商用车辆的视图的方法,包括:从限定视场的至少一个相机接收视频馈送。识别所述视频馈送中的多个对象,所述多个对象包括至少一个车轮和至少一个线。追踪所述多个对象中的每个对象通过所述视频馈送的图像平面的路径。识别与每个路径相对应的拖车角度,将识别的拖车角度与对应的路径相关联,从而生成多个拖车角度测量。将所述多个路径向下选择为单个路径,并且识别与所述单个路径相对应的单个拖车角度测量。 | ||||||
163 | 身高检测方法、装置及存储介质 | CN202180006425.1 | 2021-07-29 | CN115885316A | 2023-03-31 | 焦磊磊; 马超群; 张旭; 段超 |
本申请涉及一种身高检测方法、装置及存储介质,其中,所述方法包括:对电子设备的图像采集部件采集的多个视频帧进行语义平面检测,确定所述多个视频帧中的地面信息;对所述多个视频帧进行人脸检测,确定人脸区域;根据所述人脸区域及预设的人脸三维模型,确定所述多个视频帧中目标对象的第一人脸位姿;根据所述地面信息、所述第一人脸位姿及所述电子设备的设备位姿,确定所述目标对象的第一身高。本申请实施例的身高检测不仅不依赖于专业设备,而且能够自动对目标对象进行身高检测,无需手动定位,操作方便且准确性高。 | ||||||
164 | 运动画面文件加密方法及其数字权限管理方法 | CN200480036369.2 | 2004-12-08 | CN100449525C | 2009-01-07 | 慎东揆; 金濬一; 申东日; 金龙彬; 崔珣容 |
一种加密运动画面文件的方法、以及使用该方法的数字权限管理的方法,其中加密方法包括:从运动画面文件的元数据中提取有关至少一个作为实时流单位的视频样本的位置的信息;基于位置信息提取视频样本;基于预定加密信息,对除了每个所提取的视频样本的视频样本首标内的起始码之外所提取的视频样本加密;以及通过重新组合加密的视频样本,产生加密的运动画面文件。由于以视频对象平面(VOP)为单位对文件加密、同时维持MPEG-4文件格式,所以可将加密方法容易地应用于完整的文件格式,并还可能实现流服务。 | ||||||
165 | 运动画面文件加密方法及其数字权限管理方法 | CN200480036369.2 | 2004-12-08 | CN1918561A | 2007-02-21 | 慎东揆; 金濬一; 申东日; 金龙彬; 崔珣容 |
一种加密运动画面文件的方法、以及使用该方法的数字权限管理的方法,其中加密方法包括:从运动画面文件的元数据中提取有关至少一个作为实时流单位的视频样本的位置的信息;基于位置信息提取视频样本;基于预定加密信息,对除了每个所提取的视频样本的视频样本首标内的起始码之外所提取的视频样本加密;以及通过重新组合加密的视频样本,产生加密的运动画面文件。由于以视频对象平面(VOP)为单位对文件加密、同时维持MPEG-4文件格式,所以可将加密方法容易地应用于完整的文件格式,并还可能实现流服务。 | ||||||
166 | 描述视频内容的方法和装置 | CN00803115.0 | 2000-01-20 | CN1338089A | 2002-02-27 | 越后富夫; 黑川雅人; 前田润治; 阿尔贝托·富田 |
一个使用少量数据有效描述动态图像数据内容的方法,该方法包含步骤(1)通过使用一个表示有关对象位置的信息的参考平面来表示各个对象随时间移动的轨迹,(2)通过使用对象形状的变化提供一个基于对象运动类型的描述单元,(3)对象运动被表示成一个运动区段,(4)读取并解释基于视频内容的对象定义,动作类型的定义,基于对象交互的场景解释定义。 | ||||||
167 | 图像处理方法及装置、计算设备、存储介质 | CN202211019416.9 | 2022-08-24 | CN117670691A | 2024-03-08 | 邹瑞波 |
本公开提供了一种图像处理方法及装置、计算设备、存储介质和计算机程序产品。该方法包括:获取第一图像,述第一图像为包括第一场景的图像;基于第一图像,确定第一场景中的目标平面,目标平面包括在第一图像中检测到的至少一个平面;加载第二场景,使得第二场景的预设基准平面与目标平面重合,预设基准平面为第二场景中的预先设定的平面;获取第二图像,第二图像为包括目标对象的图像;从第二图像中提取目标对象的图像;在第二场景中呈现目标对象的图像。通过该方法,可以提供沉浸式的虚拟显示交互体验,并提供更多交互可能性。本公开实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等,并可用于游戏、视频、全景漫游等各种应用场景。 | ||||||
168 | 一种基于视场分割的双远心镜头视频引伸计 | CN202011372150.7 | 2020-11-30 | CN112525096A | 2021-03-19 | 李凯; 薛永江 |
本发明公开了一种基于视场分割的双远心镜头视频引伸计,包括双远心镜头、视频相机和上位计算机,采用双远心镜头双远心镜头正对待测试件拍摄,利用视频相机采集待测试件视频图像,传输到上位计算机进行数据处理;在双远心镜头前方的上下或左右对称放置第一组两块平面反射镜,将双远心镜头视场分为两部分,使双远心镜头视场方向垂直于光轴方向,并在在垂直光轴两侧对称放置第二组两块平面反射镜,将第一组两块平面反射镜分割的两个视场光线反射后对准待测试件。本发明利用4块平面反射镜对双远心镜头的视场进行分割,有效扩大了双远心镜头所能测量试件的标距长度,从而提高了双远心镜头视频引伸计测量精度,并使该方法能够用于更广泛的测量对象。 | ||||||
169 | 视频处理设备和方法 | CN202180066099.3 | 2021-09-28 | CN116210233A | 2023-06-02 | 南佑铉; 孙允宰; 郑铉权; 黄盛凞 |
公开了一种根据实施例的视频处理装置,其包括至少一个处理器,其中所述至少一个处理器配置成通过基于第一深度神经网络(DNN)分析包括多个图像的视频信号,为每个时间和频率生成多个特征信息,基于第二DNN从所述视频信号中提取对应于视频中对象的运动的第一高度分量和第一平面分量,通过使用第三DNN从不具有高度分量的第一音频信号中提取对应于所述音频中声源的运动的第二平面分量,从所述第一高度分量、所述第一平面分量和所述第二平面分量生成第二高度分量,基于所述特征信息输出包括所述第二高度分量的第二音频信号,以及使所述第二音频信号与所述视频信号同步并输出所述信号。 | ||||||
170 | 电子阅读器内平面书籍到富书籍的转换 | CN201380064613.5 | 2013-12-12 | CN105027116A | 2015-11-04 | R·纳拉亚南; M·刘; W·曾; R·尼克洛夫; A·吉尔 |
通过关键词标识、使用所标识的关键词进行基于上下文的搜索、对搜索结果排序、以及将经排序的搜索结果对照可由用户或管理员自定义的预定义阈值进行比较,在电子阅读器环境中平面内容(或平面书籍)被转换成富内容(或富书籍)。来自搜索结果的超过预定义阈值的文本、图形、音频、视频以及类似对象可被扩充在平面内容内的适当位置中,诸如交互性文本、音频/视频对象、图像、附加文本、或者其他交互性元素。 | ||||||
171 | 一种基于对象的分形视频压缩与解压缩方法 | CN201010167235.1 | 2010-04-30 | CN101827268B | 2012-04-18 | 祝世平; 王再阔; 候仰拴 |
本发明提出了一种基于对象的分形视频压缩与解压缩方法,该方法是基于视频内容,利用分形迭代原理进行视频编码的一种新型视频压缩编码方法。首先利用视频分割方法获得视频对象分割平面即Alpha平面,对起始帧采用块DCT变换编码,对非I帧进行块运动估计/补偿编码,首先计算与子块域和父块域相关子块的像素和与像素平方和,然后在前一帧搜索窗中利用全搜索方法寻找最相似的匹配块,最后利用Huffman编码方法压缩迭代函数系统系数。对应的解压缩过程为:对I帧采用反DCT变换的方式解码,对非I帧进行Huffman反编码获得迭代函数系统系数,然后进行基于宏块的解码,首先计算父块域相关子块的像素和与像素平方和,然后依次对当前帧中的每一个宏块进行解码。本方法引入了基于对象编码的方法并改进了传统分形视频压缩方法,不但大大提高了压缩比和峰值信噪比,而且提高了编码速度,进一步提高了分形视频压缩编码的性能,使其更加具有灵活性和实用性。 | ||||||
172 | 一种基于对象的分形视频压缩与解压缩方法 | CN201010167235.1 | 2010-04-30 | CN101827268A | 2010-09-08 | 祝世平; 王再阔; 候仰拴 |
本发明提出了一种基于对象的分形视频压缩与解压缩方法,该方法是基于视频内容,利用分形迭代原理进行视频编码的一种新型视频压缩编码方法。首先利用视频分割方法获得视频对象分割平面即Alpha平面,对起始帧采用块DCT变换编码,对非I帧进行块运动估计/补偿编码,首先计算与子块域和父块域相关子块的像素和与像素平方和,然后在前一帧搜索窗中利用全搜索方法寻找最相似的匹配块,最后利用Huffman编码方法压缩迭代函数系统系数。对应的解压缩过程为:对I帧采用反DCT变换的方式解码,对非I帧进行Huffman反编码获得迭代函数系统系数,然后进行基于宏块的解码,首先计算父块域相关子块的像素和与像素平方和,然后依次对当前帧中的每一个宏块进行解码。本方法引入了基于对象编码的方法并改进了传统分形视频压缩方法,不但大大提高了压缩比和峰值信噪比,而且提高了编码速度,进一步提高了分形视频压缩编码的性能,使其更加具有灵活性和实用性。 | ||||||
173 | 一种基于二维码的变电站开关柜设备对象自动识别方法 | CN201610915230.X | 2016-10-20 | CN106650546A | 2017-05-10 | 李茶根; 杨晟; 万辉 |
本发明公开了一种基于二维码的变电站开关柜设备对象自动识别方法,在现有的开关室视频监控系统的基础上,采用视频分析技术,通过识别开关柜上粘贴的二维码标签来识别开关柜设备对象。步骤如下:S1:图片获取及初始化处理;S2:定位图片中二维码标签所在区域;S3:通过图像平面校正将形变的二维码图像转化为标准二维码图像;S4:二维码信息读取和开关柜设备对象识别。因此,本发明提出通过视频智能分析方法识别二维码,从而自动识别开关柜的方法,对电网生产运行监控具有重要意义,对电网的智能化水平中的智能化监控技术的提升起到一定的促进作用。 | ||||||
174 | 改进的音频/视频方法和系统 | CN201080033377.7 | 2010-07-23 | CN102473172A | 2012-05-23 | J.D.洛德 |
通过使用一体数据对象(诸如修改的MPEG文件或数据流)使音频和/或视频数据与(例如,和加速度、取向或倾斜相关的)辅助传感器数据在结构上持久地相关联。以这种形式,不同的再现装置可以采用共同传送的传感器数据来改变音频或视频内容。对传感器数据的这种使用可以针对不同的用户实现个性化(例如通过偏好数据)。例如,加速计数据可以与视频数据相关联,从而允许一些用户观看视频的抖动稳定版本,并且允许另一些用户在这种运动伪影按原样保留下来的情况下观看视频。以类似的方式,诸如焦平面距离之类的摄像机参数可以与音频/视频内容共同传送,从而在摄像机从远距离对象捕捉音频/视频时允许音量被减小。一些配置采用多个图像传感器和/或多个音频传感器——每个传感器也采集辅助数据。 | ||||||
175 | 全景视频目标跟踪方法、电子设备和存储介质 | CN202210337422.2 | 2022-03-31 | CN116935256A | 2023-10-24 | 唐小林; 龙良曲 |
本申请提出了一种全景视频目标跟踪方法、电子设备和存储介质,涉及视觉目标跟踪技术领域。其中,上述全景视频目标跟踪方法包括:首先,获取目标视频在当前采样帧中待跟踪目标的信息,目标视频是全景视频经平面化处理后得到的。然后,根据待跟踪目标的信息,计算待跟踪目标在当前采样帧与下一采样帧之间的光流。进而,根据光流,确定待跟踪目标在下一采样帧中的参考坐标矩阵。最后,对参考坐标矩阵进行修正,得到待跟踪目标在下一采样帧中的有效坐标矩阵。本申请将全景视频生成的平面视频作为处理对象,避免了频繁的2D渲染过程,有效减少了目标跟踪过程的耗时,提高了目标跟踪的效率。 | ||||||
176 | 视频编码、解码方法和相应设备 | CN200480009383.3 | 2004-03-30 | CN1771736A | 2006-05-10 | C·杜福尔; G·马匡特; S·瓦伦特 |
本发明涉及一种编码方法,该编码方法被应用到一个对应于被细分成连续视频对象平面(VOP)的连续场景的视频输入序列,并且为了编码所述场景的所有视频对象,该编码方法被应用来生成一个由已编码视频数据构成的已编码比特流,其中借助于一种比特流语法来描述每个数据项,从而允许对所述比特流的内容的所有单元进行识别和解码。根据所述方法,所述语法包括被提供来独立地描述对各个通道的时间预测类型的附加语法信息,所述附加语法信息是在图像级被置于所述已编码的所生成比特流中,其或者由所有现有通道共享,或者对于每个所述通道来说是特定的。 | ||||||
177 | 超声融合成像方法、超声融合成像导航系统 | PCT/CN2014/074451 | 2014-03-31 | WO2015051622A1 | 2015-04-16 | 康锦刚; 王广志; 朱磊; 张倩; 丁辉; 杨明雷; 丛龙飞 |
本申请涉及一种超声融合成像方法、超声融合成像导航系统。该超声融合成像方法包括:选择步骤,根据输入的指令,从预先存储的至少一段超声视频数据选择至少一帧超声图像,超声视频数据包括从至少一个平面对目标对象进行采集得到的超声图像、以及与超声图像对应的位置指向信息;配准步骤,将选择出的至少一帧超声图像与模态图像进行配准,所述配准过程中使用所述至少一帧超声图像的位置指向信息;融合步骤,对配准后的超声图像和模态图像进行图像融合。不同于现有的基于实时超声的配准融合方法,本申请采用在配准前录制扫查目标对象的一段配准视频,然后选取一帧或多帧超声图像进行配准。 |
||||||
178 | MPEG-4视频数据的编码方法 | CN02800255.5 | 2002-02-25 | CN1224263C | 2005-10-19 | P·根特里克; B·尼佐特; Y·拉曼津 |
本发明涉及一种用于根据MPEG-4标准对由一个或多个比特流组成的视频数据进行编码的方法和装置。为了避免当将视频元素映射到系统元素中的任何问题,选择特定的对准/分段机制。根据这种机制,当利用对应于将包括在视频数据中的视频对象平面(VOP)分段为视频分组(VP),以及将视频分组分段为数据分区(DP)的语法模式,对所述视频比特流进行编码时,视频数据分区被映射到一个或多个SL分组中(SL1、SL2、SL3、SL4...),第一个视频数据分区(DP1)的开始总是被映射到SL分组的开始,并且传输第一个数据分区的最后一个SL分组包括分隔标记以及多达7个后续第二数据分区(DP2)比特,从而获得字节对准,下一SL分组开始于第二数据分区的下一比特。 | ||||||
179 | MPEG-4视频数据的编码方法和装置 | CN02800255.5 | 2002-02-25 | CN1457602A | 2003-11-19 | P·根特里克; B·尼佐特; Y·拉曼津 |
本发明涉及一种用于根据MPEG-4标准对由一个或多个比特流组成的视频数据进行编码的方法和装置。为了避免当将视频元素映射到系统元素中的任何问题,选择特定的对准/分段机制。根据这种机制,当利用对应于将包括在视频数据中的视频对象平面(VOP)分段为视频分组(VP),以及将视频分组分段为数据分区(DP)的语法模式,对所述视频比特流进行编码时,视频数据分区被映射到一个或多个SL分组中(SL1、SL2、SL3、SL4...),第一个视频数据分区(DP1)的开始总是被映射到SL分组的开始,并且传输第一个数据分区的最后一个SL分组包括分隔标记以及多达7个后续第二数据分区(DP2)比特,从而获得字节对准,下一SL分组开始于第二数据分区的下一比特。 | ||||||
180 | 基于可解释视觉推理模型的危险预警描述自动生成方法 | CN202010106747.0 | 2020-02-19 | CN111325347B | 2023-04-11 | 聂礼强; 战新刚; 何建明; 赵振兵; 甘甜; 董兴宁 |
一种基于可解释视觉推理模型的危险预警描述自动生成方法,包括建立特定场景的先验知识库和训练数据库,通过迁移学习微调模型以得到针对该场景下的平面目标检测器和三维目标检测器;然后针对某一帧视频信息,通过平面目标检测器检测出所有目标类型和目标的平面位置特征,再并行地通过三维目标检测器得到所有目标的三维空间特征,并根据检测出的目标类型、结合先验知识库构造该帧视频下的关系任务图,将其通过图神经网络抽取特征后,融合上述的平面空间特征和三维空间特征,送入模块化的多层感知机中进行推理学习,最终得到该帧视频图像下存在的危险等级和具有危险关系的对象,最后结合先验知识库中的语义转换生成该帧视频图像所对应的中文描述。 |