已屏蔽 原因:{{ notice.reason }}已屏蔽
{{notice.noticeContent}}
~~空空如也

呵呵,后来我仔细分析了一下,其实也并不难实现,我们一起来分析一下吧:
识别策略:
假如要识别一段广告,我们取10帧画面,每帧画面取10个点,每个点用最简单的8位(1字节)进行量化再存储,暂且称之为这段广告的\"视频指纹\"吧,这样,每记忆一段广告需要10(帧)×10(点)×1(字节)×3(RGB三色)=300个字节,这样的话,一个64KB的存储器都能存储218个节目的\"视频指纹\",如果每帧画面取一个8位的声音特征,那识别这段广告还要10个字节,也就是说,每段广告的视频指纹加音频指纹(复合指纹)的体积是10×10×3+10=310字节,那么64KB就能存储211条广告的复合指纹.
按照我国采用的PAL制式的电视信号格式,每秒钟有50帧图像,而且是隔行扫描所生成的——这是电视制式决定的,和电视机这个终端如何最终处理没有关系——而据刚才的分析,每帧图像都需要进行量化采样,就是说,每秒钟需要50(帧)×10(点)×3(字节)+50=1550的量化数目.
在存储上和数据量化上,完全没有任何技术难度,不管是用FlashROM,或者铁电存储器,或者RAM,都不成问题.


匹配过程:
首先,假设一下,我们在半年后,已经识别存储了200条不喜欢的广告,那么,处理器就需要在这200项复合指纹中逐个比对,看是否有复合条件的.
第二,我们都知道,电视的画面和声音都是连续的,因此就需要采用\"移位校对\"的方式,而不能是校对完第一个10帧之后,把第11帧当作第二次校对的第1帧,因为那个广告可能会从第2帧或者第3帧开始才满足所记录的指纹,也就是说,每帧图像都要当一次\"第一帧\".
第三,因为画面和声音的连续性,因此我们并不能预测接下来会收到怎样的信号,所以每次只需要采集1帧的数据,并到数据库里去进行匹配.
因此,综上所述,我们所需要实现的功能实际上就是这个样子:
1.每帧画面采集31个数据,30个视频数据和1个声音数据;
2.用这31个数据,到数据库里去找,只找第1帧,看看是否有匹配的.如果有,则设置一个标志,表示\"有可疑的家伙\";
3.采集下一帧的数据,也是31个字节,然后看是否有\"可疑\"标志,如果有,则直接去匹配那个打了标记的记录的第2帧,如果还匹配,那就保持标志不动,继续下一帧;如果不匹配了,就清掉那个标志,然后跳到第2步.
上面这三条,就是全部的匹配过程了.
实际上,惟一的要求,就是上面的这第2和第3步,需要在前一帧结束后,和后一帧开始前,全部完成,否则后面的工作就会赶不上趟了.
如果在加上一些其它的处理,比如说匹配程度的计算,是90%相似就判定为匹配,还是95%相似,这需要进行浮点计算,对处理器的运算能力要求就会更高一点,但这在技术上也基本不成问题.


惟一的问题是,怎样去保证,记录时候的采样点,和匹配时的采样点完全重合?
我们知道,PAL的行频是15625Hz,也就是说,每秒钟有15625行的信号会经过采样元件的\"门口\",那么如何在这么多的信号中采集到合适的点呢?
假设:我们把每帧图像(PAL标准的图像长宽比是4:3)分成240(线)×320(每行的数点),那就是76800个点(注意,这是人为\"分\"出来的点,在实际的信号中并没有这样的点,而是一个连续变化的模拟量,而正因为是连续变化的模拟量,所以偏差哪怕一丁点,结果也会有所不同),这是1秒钟的1/50的时间里所经过的点,时间是20毫秒,所以每个点的持续时间就是≈0.26微秒,稍微多一点点,但在设计的时候必须要大于这个时间,所以用0.25微秒基本上够用了,这个时间是4兆赫频率的一个周期的时间.
但是考虑到定时的精确性,以及前后两个\"点\"之间的持续性,因此采样的时间只能是这个\"点\"的持续时间的1/3甚至1/4,那么采样的时间就是0.065~0.08微秒之间,就是12.5MHz~15.38MHz.
这个时间对于8位的转换器来说是很容易实现的.
每一行扫描的时间是64微秒,而且每两行之间会有一个回扫动作,其实就可以利用这个回扫动作来作为时间基准,这样的话,从64微秒去定义一个0.065微秒,也就只有不到1000的分隔了,累积误差就会小许多了.
如果,每个点都采集一次声音信号,那么每个点的数据就刚好是8×4=32位,很适合用32位的处理器来处理,虽然采集这么多声音信号没有太多意义,而且会造成所能存储的广告条数减少(64KB约能存163条),但163条也大概没人可以用完.即使用32KB的存储器,也能存82条,呵呵,足够了.


综上所述,采用32位的ARM7或者DSP芯片,加上数据转换芯片,再加上并行接口的32位高速RAM或者铁电存储器(只能用这两者,其它的速度达不到),以及用于保持RAM内容的附加电源,还有一些辅助的电路(比如信号调节等等),就可以组成LZ所说的系统硬件了,写个相应的程序就能实现LZ所说的功能了.
这样的一套东西,成本也就百来块钱RMB,量大的话还会少.
当然,这样的东西,还是只适合装在电视机里面,而基本上不太适合装在遥控器里.

+1033  科创币    delete   2008-04-01    fantastic
文号 / 28445

百炼成钢
名片发私信
学术分 1
总主题 8 帖总回复 153 楼拥有证书:学者 笔友
注册于 2008-03-09 23:00最后登录 2018-01-10 01:03
主体类型:个人
所属领域:无
认证方式:邮箱
IP归属地:未同步

个人简介

暂未填写
文件下载
加载中...
{{errorInfo}}
{{downloadWarning}}
你在 {{downloadTime}} 下载过当前文件。
文件名称:{{resource.defaultFile.name}}
下载次数:{{resource.hits}}
上传用户:{{uploader.username}}
所需积分:{{costScores}},{{holdScores}}下载当前附件免费{{description}}
积分不足,去充值
文件已丢失

当前账号的附件下载数量限制如下:
时段 个数
{{f.startingTime}}点 - {{f.endTime}}点 {{f.fileCount}}
视频暂不能访问,请登录试试
仅供内部学术交流或培训使用,请先保存到本地。本内容不代表科创观点,未经原作者同意,请勿转载。
音频暂不能访问,请登录试试
投诉或举报
加载中...
{{tip}}
请选择违规类型:
{{reason.type}}

空空如也

插入资源
全部
图片
视频
音频
附件
全部
未使用
已使用
正在上传
空空如也~
上传中..{{f.progress}}%
处理中..
上传失败,点击重试
等待中...
{{f.name}}
空空如也~
(视频){{r.oname}}
{{selectedResourcesId.indexOf(r.rid) + 1}}
处理中..
处理失败
插入表情
我的表情
共享表情
Emoji
上传
注意事项
最大尺寸100px,超过会被压缩。为保证效果,建议上传前自行处理。
建议上传自己DIY的表情,严禁上传侵权内容。
点击重试等待上传{{s.progress}}%处理中...已上传,正在处理中
空空如也~
处理中...
处理失败
加载中...
草稿箱
加载中...
此处只插入正文,如果要使用草稿中的其余内容,请点击继续创作。
{{fromNow(d.toc)}}
{{getDraftInfo(d)}}
标题:{{d.t}}
内容:{{d.c}}
继续创作
删除插入插入
插入公式
评论控制
加载中...
文号:{{pid}}
加载中...
详情
详情
推送到专栏从专栏移除
设为匿名取消匿名
查看作者
回复
只看作者
加入收藏取消收藏
收藏
取消收藏
折叠回复
置顶取消置顶
评学术分
鼓励
设为精选取消精选
管理提醒
编辑
通过审核
评论控制
退修或删除
历史版本
违规记录
投诉或举报
加入黑名单移除黑名单
查看IP
{{format('YYYY/MM/DD HH:mm:ss', toc)}}
ID: {{user.uid}}