-
硬字幕提取神器:Video Subtitle Extractor
2025-08-31 03:35:39 今晚世界杯
硬字幕、软字幕、外挂字幕
视频与字幕的结合一般有三种方式:硬字幕和软字幕、外挂字幕。
硬字幕:又叫内嵌字幕。字幕被直接嵌入到视频文件中,无法更改或删除。
软字幕:又叫内挂字幕、封装字幕、内封字幕。加字幕的过程叫做封装。视频一般为mkv格式。
外挂字幕:字幕文件与视频文件分开存储,播放时需要用户手动加载字幕文件(如字幕文件与视频文件相同命名,播放器会自动加载)。字幕一般为srt、ass、ssa等格式。
各种字幕的优缺点
特性
外挂字幕
硬字幕
软字幕
优点
易于替换或删除不影响视频文件本身 可以灵活选择语言
兼容性好,无需额外文件适合在不支持软字幕的设备上播放
保持视频文件的完整性可以包含多种语言的字幕允许用户选择是否显示字幕
缺点
需要额外的字幕文件有时可能会遗漏或不匹配
不可更改或删除可能会影响视频内容的观看
- 播放时需要额外处理- 可能不支持所有播放器- 字幕编辑和更换较为复杂
兼容性
需要支持字幕功能的播放器,已普及能不适用于所有播放设备
与大多数播放器和设备兼容无需额外组件
需要支持内封字幕的播放器,已普及通常与MKV等容器格式一起使用
控制性
用户可以完全控制字幕的显示可以轻松更改字幕样式和内容
一旦嵌入,用户无法更改无法适应不同的语言需求
用户可以控制字幕的显示和隐藏可以更换或删除字幕文件
应用场景
适合需要频繁更换字幕或多语言版本的视频适合字幕编辑和翻译工作
适合商业发行或DVD制作适合不需要字幕切换的视频
适合高清视频和多语言版本的需求适合需要用户自定义字幕显示的环境
硬字幕提取神器:Video Subtitle Extractor
硬字幕本质上是字幕是视频画面的一部分,提取硬字幕的过程就是提取视频画面中的字幕部分。其本质上是一个OCR(Optical Character Recognition)问题,即光学字符识别。OCR技术是一种将图像中的文字转换为可编辑、可搜索的文本的技术。OCR技术比较成熟,有很多开源的OCR引擎,如Tesseract。
GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository)
今天要介绍的Video Subtitle Extractor就是一个基于OCR技术的硬字幕提取工具。它是一个基于深度学习的视频字幕提取框架,包含字幕区域检测、字幕内容提取。它可以提取视频中的硬字幕,并生成srt文件。无需申请第三方API,本地实现文本识别。
https://github.com/YaoFANGUK/video-subtitle-extractor
这个工具是一个GUI工具,使用起来非常简单。只需要打开视频文件,选择字幕区域,然后点击提取按钮,就可以提取硬字幕了。提取的字幕会保存为srt文件,可以用于其他视频播放器。
视频演示
硬字幕提取神器:Video Subtitle Extractor 哔哩哔哩 bilibili
参考资料
What is Subtitle (Soft/Hardcoded Sub & Forced Sub/CC/SDH)?
视频中的外挂字幕、硬字幕、软字幕定义的区别_硬字幕和软字幕的区别-CSDN博客
GitHub - YaoFANGUK/video-subtitle-extractor: 视频硬字幕提取,生成srt文件。无需申请第三方API,本地实现文本识别。基于深度学习的视频字幕提取框架,包含字幕区域检测、字幕内容提取。A GUI tool for extracting hard-coded subtitle (hardsub) from videos and generating srt files.