MP4遇到字幕老问题

来源 :电脑爱好者 | 被引量 : 0次 | 上传用户:Viola2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  前段时间我购入了新的MP4,结果发现从网上下载的视频内嵌字幕大多太小,很难看清楚,还是有必要再重新下载新的字幕文件。别人都说我事多,没办法,我一直就是个完美主义者。
  
  字幕文件分为图片型和文本型两类,常见的图片型字幕由IDX和SUB两个文件构成,前者是时间轴导引文件,确定每段字幕的显隐时间,后者则是每段字幕的图片,即把每段文字转成图片的形式,再把IDX和SUB两个整合在一起而成。文本型最常见的是SRT和SSA两种:其中SRT文件可以直接用记事本程序打开编辑,而SSA文件必须用Sub Station Alpha等专门软件处理。
  我那MP4支持的字幕格式是SRT,于是麻烦来了—从网上下载的字幕文件类型有很多,这意味着要将图片型字幕想转换为SRT格式,这是比较麻烦的过程。要用到两个软件:SubRip(下载地址:http://work.newhua.com/cfan/200806/SubRip.rar,快车代码:CF0806SZDM01)和SubToSrt(下载地址:http://work.newhua.com/cfan/200806/SubToSrt.rar,快车代码:CF0806SZDM02)
  
  英文字幕的转换
  
  1 打开SubRip,选择“文件→打开Vob文件”菜单项,在弹出窗口中,点击“打开文件目录”按钮,选择SUB文件,之后,将“语言数据流”设置为“English”,同时勾选“字幕图片通过OCR转换成文本”,点击“开始”(见图1)。
  


  (1)
  2 现在识别每个字符,即识别该图片中拆成单个字母的最小图片,我们只需要在首次识别该图片时输入相应字母,当这个图片再次出现时,就会自动识别了。其实还是靠人识别,由该软件建立起一个字符和图片的对应关系。而这个对应关系,在这个软件中被称为字符点阵(见图2)。
  


  (2)
  p字符点阵可以保存,但一般各部电影的点阵文件都不同,例外情况是,如果是系列的纪录片,那这个点阵文件就可以适用于这个系列中的所有英文字幕,即省去第一遍的字符输入
  
  3 识别完成后,可单击下方的“文件→另存为SRT文件”菜单项,得到文本格式的英文字幕。
  识别完成,得到SRT文件并非就万事大吉了,有个问题:在相当多的图片字幕中,图片字母的字体为Arial,该字体的“l”和大写的“I”外形相同!由于“l”的使用频率更高,且“I”往往是位于句首,后期修改较为方便,所以识别时应统一识别为“l”。可以想象:字幕中有若干个“我”被识别成“l”,还有lt、lts、lf、ln…如果用记事本逐行改那上千行的字幕文本,还不能误改其中正确的“l”,相当头大。这里可以用Word中的“全部替换”来帮忙:用Word打开转换后的SRT文件,点击菜单中的“编辑→替换”项,勾选高级中的“区分大小写”、“全字匹配”后,替换内容为“l”;替换为“I”,单击“全部替换”。接下来将lt替换为It,之后依次替换正确的Is、Its、If、In、Into(前面是出错频率最高的),常见的还有Instead、Inside、Including、Immediately等。完成后最好再把全文过一遍。因为在Word中,拼写错误都会有红色下划线标注,非常醒目,这样可以基本搞定像FBI、CIA这些漏网之鱼。最后保存即可。
  
  中文字幕的转换
  
  SubRip实际上也是可以直接转换中文字幕的,但是由于准确率和速度不及SubToSrt,因此总的转换步骤为:先用SubRip把那个SUB整文件拆成每行的单个图片字幕,再由SubToSrt识别为中文。
  
  1运行SubRip,同样选择“文件→打开Vob文件”菜单项,在弹出窗口中,点击“打开文件目录”按钮,选择SUB文件,之后,将“语言数据流”设置为“Chinese”(有时也可能显示为gb、Chs等),同时勾选“字幕图片保存为4bit的BMP文件”,并勾选“加时间和尺寸”,“开始”即可(见图3)。
  2输入任意文件名(最好新建一个文件夹,因为每段字幕将生成一个BMP文件,因此有可能有上千个小图片文件),“保存”即可(最终生成的中文字幕名称和现在的文件名称完全无关)。
  


  (3)
  3在弹出窗口中选择“I-Author”,勾选“Custom Colors and Contrast”,把颜色#1~#4全部选择成白色(#1~#4分别代表字芯、字框、背景、消除走样,不同电影字幕的#1~#4所代表的都不一样),以便测试出哪一个为字芯,将其设为黑色,其他3项全部设为白色(见图4)。
  


  (4)
  p这样可以使每段图片字幕的文字处于最容易识别的状态。要注意的一点就是在调整颜色时,必须要点“基本颜色”下的白色和黑色,“自定义颜色”中的黑色点击后无效,整个字幕段仍无法正常显示
  
  4SubRip自动将每一幅图片保存为BMP,并且加上相应的时间顺序,再依次点击“输出格式→设置输出格式”下的“SubRip”,点击“转换成此格式”,“另存为→保存”即可(见图5)。
  


  (5)
  p此时弹出的对话框是提示你这种格式不是最好的选择。由于我们接下来要在SubToSrt中继续识别,所以不必理会,点击“确定”
  


  (6)
  p上图在窗口左下角依照字幕调节“空格检测设置”、“空格宽度设置”及“行高检测灵敏度”
  
  5打开SubToSrt,选择“文件→打开SRT或SSA文件”菜单项,选取刚才保存的SRT文件。然后点击“图片处理→自动裁剪”菜单项(见图6),最后点击“识别→开始识别”菜单项。该软件同样是把大图片拆成每个汉字的小图片,然后根据软件中已知的字库(图片和汉字的对应数据库,类似SubRip的字符点阵,但比后者复杂得多。网上可以下载到,最大的有50MB,这是因为英文变来变去就那52个形状,而中文的方块字字形就太复杂了)进行识别。当遇到不认识的字时,会自动跳出窗口要求丰富字库,输入该字,按回车即可。因此可能开始时很多内容要识别,但是随着识别的不断进行,字库文件中的内容不断增加,需要识别的内容会越来越少(见图7)。
  


  (7)
  p经过我“训练”的SubToSrt,现在识别一部电影平均只需输入两三个字。如果汉字分为左右部分,识别时有时会只显示半个字,按扩展(Alt+E),即可显示全字
  
  6识别完毕后,会自动替换已知错误词组。接着,可以看一下字幕,如有需要,可以略作修改(如原SUB字幕中就是错误的,部分繁体字的字幕由于习惯不同,质量不太好,可自行修改)。
  
  7点击“文件→保存为SRT或SSA格式”菜单项,保存为SRT格式即可。注意,在保存好后退出SubtoSrt时,软件需要一定的时间去存储刚刚扩充到字库文件中的新内容,如果强行结束程序,将导致字库文件的损坏。
  现在把转换好的SRT字幕和视频文件使用相同的文件名复制到MP4中,就可以在MP4的小屏幕看到清晰的字幕了。不错,很完美!我很满意!
其他文献
闷豆近来很郁闷,为了升级本本,能换的都换了,这不,现在又打上了升级CPU的小算盘……  很多笔记本玩家都希望能通过升级来获得更快的运算速度。除了最常见的升级内存、硬盘,在性能方面还能够进行升级的恐怕就剩下CPU一项了。不过相比之下,升级本本的CPU可要麻烦得多。    目前市场上能够接触到的本本CPU无非以下几种:ES版CPU、BGA植球CPU、盒装CPU、正式版CPU。正式版CPU多是其他玩家升
期刊
傻博士有话说:  索引的原理,类似图书馆的编目工作:想要在成千上万本的图书中找到自己需要的信息是非常麻烦的,所以图书馆的工作之一就是将所有的书籍进行编目,形成分类目录、书名目录、作者目录等等,有了这些目录索引,我们就能快速准确地查找信息了。索引服务编制完成的正是这样的工作,它通过一系列规则筛选出索引信息再加上文件系统目录的存储属性形成编目文件(实际就是一数据库),搜索时实际就是在这个索引数据库中查
期刊
【摘要】目的:探讨护理路径对重型颅脑损伤患者生活质量的影响。方法:选择2011年5月-2012年5月我院收治的60例重型颅脑损伤手术病例,所有患者都采用积极的手术治疗与药物对症处理,同时给予护理路径方法。结果:本组患者死亡3例,存活57例,存活率为95.0%。同时经过护理后,存活患者在生活质量的4个维度得分及总分上都明显高于护理前(P<0.05)。结论:护理路径在重型颅脑损伤手术患者的应用可提高患
期刊
网络时代,一切都变得便捷起来,比如用淘宝直充,既方便又省钱,这是利用网络节省话费的第一个环节。第二个环节就是利用日益普及的飞信了,如果有可能,你的短信费就此省下了。    用淘宝直充省点  第一步:  选择“充值卡”  首先,登录淘宝,点击“我的淘宝”,在左边的功能块中选择“我的直充”—“手机直充”。依次选择完“运营商”、“地区”及“面值”等信息后,点击“查看淘宝折扣价”,淘宝会列出你所选面值的相
期刊
许多朋友在出游时喜欢拍摄一些风景照,回来以后这些照片往往被遗忘,不如把它做成一幅漂亮的油画。使用Photoshop CS2的滤镜工具,几步就可以轻松帮你完成一幅油画。      1 用Photoshop CS2打开你想要变成油画的照片。使用两次复制图层快捷键Ctrl+J,复制出两个图层。  2 关闭图层1副本前面的小眼睛使之隐藏,点击图层1使它处于修改状态。在菜单中选择“滤镜→艺术效果→水彩”,具
期刊
【摘要】目的 主要对知己健康管理在社区2型糖尿病综合治疗的作用进行研究。方法 运用知己健康管理的方法对60例2型糖尿病患者进行了相关的强化管理和综合治疗,通过对患者的生活方式和综合管理防治效果的观察、分析,有效的指导患者科学的用药、适当的调节情绪实现对危险因素的有效控制。在这个过程当中,有关的医护人员通过相关糖尿病方面知识的讲解以及个性的健康指导进而使得患者能够学会对于疾病的自我管理、保健,从而有
期刊
英文单词Air原意是空气,用这个词汇做产品名称的企业都有一个特性:喜欢追求极致。AIRBUS 380,即世界上最大的民用客机,由欧洲空中客车公司研制成功,2007年它的首次试飞引起了全球关注;Macbook Air,即苹果公司制造的“世界上最薄的笔记本电脑”,1月15日一上市立即成为了全球关注度最高的IT产品。    一个最大,一个最薄,不由得让人们对Air为名的产品产生了无限的渴望与遐想。然而,
期刊
不少朋友买硬盘的时候只注意硬盘容量,却往往忽略了硬盘的缓存大小及作用意义。像CPU需要二级缓存一样,硬盘其实也是需要缓存来缓冲数据的。硬盘的缓存主要作用是1.预读取,2.写入前缓存,3.临时存储最近访问的文件内容。这三个作用都能有效提升硬盘性能、降低硬盘读写操作频率,非常重要。  新春一过商家自然又忙碌起来,去年年末上市的希捷7200.11硬盘产品终于开始大量上市了。充足的货源加之售价逐步回落,让
期刊
医院文化是社会主义物质文明和精神文明在医院中的集中表现,它是医院在医疗、预防、保健实践中创造出来的,是具有医院自身特征的物质和精神财富的总和。是职工共同的价值观、道德观和行为准则,其核心是价值观念和精神内涵。一般分为物质文化、制度文化、精神文化三个由浅及深,由表及里的层次结构。  1 精神文化是医院文化建设的核心  医院精神是医院文化的核心,也是医院精神文明建设的核心。树立良好的医院精神,可以引导
期刊
作为航嘉知名度最高的产品之一,冷静王标准版一直以噪音低、品质出众受到消费者的青睐。然而最近市场上出现了一种假冒的冷静王标准版电源,由于普通消费者无法辨别电源的真伪,导致很多人不知不觉买了假货。其实真货和假货之间还是有比较明显的区别,只要仔细观察,不难看出假货的破绽。    1 从外观上可以看出,真货的外壳做工精细,板材较厚,特别是接缝处十分平滑。而假货做工粗糙,外壳材质又轻又薄。    2 即使是
期刊