永发信息网

如何实时h264编码及aac编码

答案:1  悬赏:80  手机版
解决时间 2021-02-24 21:38
如何实时h264编码及aac编码
最佳答案
1. 简单介绍
  
  首先是捕获,这里采用了DirectShow的方式,对它进行了一定程度的封装,包括音视频。好处是直接使用native api,你可以做想做的任何修改,坏处是,不能跨平台,采集音视频这种应用,linux平台也是需要滴呀。有跨平台的做法,对视频,可以使用OpenCV,对音频,可以使用OpenAL或PortAudio等,这样就行了。
  
  编码可以选择的余地比较大,对视频来讲,有H264, MPEG-4, WebM/VP8, Theora等,音频有Speex, AAC, Ogg/Vorbis等,它们都有相应的开源项目方案,我采用的是x264进行H264编码,libfaac进行aac编码,之后是否更改编码方案,等具体项目需求再说了。这里提一下WebM,Google牵头的项目,完全开放和自由,使用VP8和Vorbis编码,webm(mkv)封装,有多家巨头支持,目的是想要取代当前的H264视频编码,号称比后者更加优秀,我没有测试过实际效果。不过有商业公司牵头就是不一样,各项支持都很全面,有时间了关注一下。
  
  
  
  2. 逻辑和流程
  
  基本的思想是实现dshow ISampleGrabberCB接口,通过回调来保存每一个buffer。除了界面线程和dshow自己的线程之外,我们启动了两个线程,AudioEncoderThread和VideoEncoderThread,分别从SampleGrabber中取出数据,调用编码器进行编码,编码后的文件可以直接输出。看图:
  
  
  
  程序是用VS2010构建的,看张工程截图:
  
  
  
  Base下面的是对系统API的一些简单封装,主要是线程和锁。我这里简单也封装的了一下dshow的捕获过程,包括graph builder的创建,filter的连接等。directshow是出了名的难用,没办法,难用也得用。因为是VS2010,调用的Windows SDK 7.1中的dshow,没有qedit.h这个文件,而它正式定义ISampleGrabberCB的。不急,系统中还是有qedit.dll的,我们要做的就是从Windows SDK 6.0中,把它拷过来,然后在stdafx.h中加入这几行代码,就可以了
  
  1 #pragma include_alias( "dxtrans.h", "qedit.h" )
  2 #define __IDxtCompositor_INTERFACE_DEFINED__
  3 #define __IDxtAlphaSetter_INTERFACE_DEFINED__
  4 #define __IDxtJpeg_INTERFACE_DEFINED__
  5 #define __IDxtKey_INTERFACE_DEFINED__
  6 #include "qedit.h"
  
  
  3. 音视频编码
  
  相关文件:
  
  
  
  Encoder下就是音视频编码相关的代码。X264Encoder封装了调用x264编码器的操作,FAACEncoder封装了调用libfaac编码器的操作,VideoEncoderThread和AudioEncoderThread负责主要的流程。下面我把关键代码贴出来,大家可以参考一下。
  
  A. 视频编码线程
  
  主要流程是首先初始化x264编码器,然后开始循环调用DSVideoGraph,从SampleGrabber中取出视频帧,调用x264进行编码,流程比较简单,调用的频率就是你想要获取的视频帧率。要注意的一点是,x264进行编码比较耗时,在计算线程Sleep时间时,要把这个过程消耗的时间算上,以免采集的视频帧率错误。
  

  B. 音频编码线程
  
  主要流程和视频编码线程相同,也是初始化FAAC编码器,然后循环调用DSAudioGraph,从SampleGrabber中取出视频帧,调用faac进行编码。和视频不同的是,音频的sample的频率是非常快的,所以几乎要不断的进行采集,但前提是SampleGrabber中捕获到新数据了才行,不然你的程序cpu就100%了,下面代码中IsBufferAvailaber()就是做这个检测的。
  

  调用faac进行编码的时候,有点需要注意,大家特别注意下,不然编码出来的音频会很不正常,搞不好的话会很头疼的。先看下faac.h的相关接口
  

  1 faacEncHandle FAACAPI faacEncOpen(unsigned long sampleRate, unsigned int numChannels,2 unsigned long *inputSamples, unsigned long *maxOutputBytes);3 4 int FAACAPI faacEncEncode(faacEncHandle hEncoder, int32_t * inputBuffer, unsigned int samplesInput,5 unsigned char *outputBuffer, unsigned int bufferSize);

  faacEncEncode第三个参数指的是传入的sample的个数,这个值要和调用faacEncOpen返回的inputSamples相等。要做到这点,就要在dshow中设置好buffsize,公式是:
  
  BufferSize = aac_frame_len * channels * wBytesPerSample// aac_frame_len = 1024
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
用完眼霜还用在眼部涂面霜吗? 白天需要防晒
桂苑饼屋这个地址在什么地方,我要处理点事
【法国在哪个洲】法国位于哪个大洲
一元夺宝有人中过吗
重庆交通信息卡损坏如何办理
天成复印部在哪里啊,我有事要去这个地方
该值班医师严重缺乏的美德是A.克己B.利人C.同
邮票被水泡了,怎么办?
跟帅哥谈恋爱是什么感觉?
逛街的时候,他/她的鞋带松了,你会俯身
由于市场利率变化而使债券持有人面临的风险,
在一家工作室实习四个月了每天都无所事事还经
小文冲我想知道这个在什么地方
入深圳户口需要什么条件
水平仪红外线有时亮有时无,但绿灯亮
推荐资讯
勘察设计费是指委托勘察设计单位进行工程水文
请用诗句赞美西子胡
鑫圣汗蒸洗浴在哪里啊,我有事要去这个地方
冰禾伙香辣坊这个地址在什么地方,我要处理点
DNF什么是欧皇气息缠身
怎样检查是否动脉硬化
14一建年限证明材料咋填呀?
日文:<夫君大人>怎么写?
怎样查看电脑工作记录?
我在陌陌跟一个美女互相关注了,但是他今天突
清波公寓北门怎么去啊,有知道地址的么
学公共艺术设计怎么样?
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?