我想把一些英文电影的字幕文件转换成材料学习,但是苦于不精通word,
文档编辑除了问题,主要是数字的删除,例子如下:
897
01:44:31,348 --> 01:44:34,599
我们的行为代价昂贵
The cost of our actions is high.
只想留下:
我们的行为代价昂贵
The cost of our actions is high.
而且还想把中文和英文分离出来,分别做成单独的文本,希望大虾能赐教,感激不尽.......
敬候佳音
回答的好还加分哦
还有问题就是字幕文件中有很多数字,上面的897
就是字母当前段的标号,需要删除。字幕的编号有很多,从1到1000多,如果有的字幕很长的话,但是字幕中人物的对话中也可能含有数字,最好不要删除,如果删除的话我也可以接受。
呵呵,啰嗦了,还请见谅。
现在最重要的是字幕编号的删除问题 ,另外我使用的是word2003
lily_blues的回答完全可以实现,但是由于剪切出来的英文都是一句占一行,打印出来太浪费纸张,怎么去除空白行和自动在句末添加标点和自动排版呢?期待您能够帮助我完成最后的工作
word 关于字幕文件中数字的删除
答案:3 悬赏:10 手机版
解决时间 2021-04-09 19:34
- 提问者网友:萌卜娃娃
- 2021-04-08 20:57
最佳答案
- 五星知识达人网友:行雁书
- 2021-04-08 22:16
一、如果想要准确删除字幕编号和时间标记,请在Word中进行如下操作:
1、键入CTRL+H打开替换窗口;
2、查找内容:“<[0-9]@^13[0-9]{2}:[0-9]{2}:[0-9]{2},[0-9]@ ”
请注意不要带引号,而且在最后的“@ ”后面有一个空格!
3、替换为:(空)
4、钩上“使用通配符”(你可能需要单击“高级”展开完整的替换窗口);
5、单击“全部替换”;
6、再从步骤2开始重复执行一次直到步骤5,但是这次的查找内容为“--\> [0-9]{2}:[0-9]{2}:[0-9]{2},[0-9]@^13”,替换为内容仍然为空,全部替换。
7、关闭替换窗口,检查文档中的字幕编号和时间标记是否都已被删除。
需要分别执行两次替换操作的原因是,Word的查找/替换功能对于控制字符的复杂程度支持有限制。如果把两次的查找控制字符串合并在一起执行的话,Word会报错说查找内容太复杂无法执行!:( 所以只好拆成两次来做了。
上述的操作只会删除字幕编号和时间标记,对于字幕正文里面的数字不会有任何影响。dp175h朋友的方案好象会把正文里面的数字也删除,而且时间标记也没有删除干净,还会留下一些多余的“:”、“-->”和“,”等。
二、在上面执行的结果之上想要把中英文分别提取出来,请执行如下操作:
1、CTRL+F打开查找窗口;
2、查找内容:<[a-zA-Z]@*^13
3、钩上“使用通配符”(可能需要单击“高级”展开完整的查找窗口);
4、钩上“突出显示所有在该范围找到的项目”,然后在下拉框里面选中“主文档”,单击“查找全部”;
5、关闭查找窗口,检查文档中的英文是否已经被全部选中了;
6、键入CTRL+X剪切所有选中的英文到剪贴板;
7、CTRL+N新建一个文档,键入CTRL+V把剪贴板上的英文粘贴过去;
8、现在就有了两个文档,一个全部是中文,另一个全部是英文。
请注意,我上面的全部操作步骤都是针对Word 2003的,如果楼主使用的是2007的话,需要做一些调整。主要的区别在于:
* “高级”按钮变成了“更多”
* 二4中的步骤改为:单击“在以下项中查找-主文档”。
其余步骤类似。
________________________________________
补充:
一、如果句子都太短,导致页面右方出现大面积空白的话,是否可以考虑对整个文档做个分栏操作?分成两栏后,右面的空白部分就可以利用上了。估计是可以节省一点纸张的。
二、去除空白行:
1、CTRL+H打开替换窗口;
2、查找内容:^p^p
3、替换为:^p
4、不要钩“使用通配符”;
5、连续执行几次“全部替换”,直到所有的空行被删除。
三、自动在句末添加标点:请问这个的具体要求是什么?在哪个句末加标点?加什么标点?
四、“自动排版”?——抱歉我不太明白这个是什么意思……
此外,如果楼主还有进一步的问题的话,可以直接HI我或者发百度消息。因为这里补充回答好象有次数限制,补充几次之后就不能再改了。
1、键入CTRL+H打开替换窗口;
2、查找内容:“<[0-9]@^13[0-9]{2}:[0-9]{2}:[0-9]{2},[0-9]@ ”
请注意不要带引号,而且在最后的“@ ”后面有一个空格!
3、替换为:(空)
4、钩上“使用通配符”(你可能需要单击“高级”展开完整的替换窗口);
5、单击“全部替换”;
6、再从步骤2开始重复执行一次直到步骤5,但是这次的查找内容为“--\> [0-9]{2}:[0-9]{2}:[0-9]{2},[0-9]@^13”,替换为内容仍然为空,全部替换。
7、关闭替换窗口,检查文档中的字幕编号和时间标记是否都已被删除。
需要分别执行两次替换操作的原因是,Word的查找/替换功能对于控制字符的复杂程度支持有限制。如果把两次的查找控制字符串合并在一起执行的话,Word会报错说查找内容太复杂无法执行!:( 所以只好拆成两次来做了。
上述的操作只会删除字幕编号和时间标记,对于字幕正文里面的数字不会有任何影响。dp175h朋友的方案好象会把正文里面的数字也删除,而且时间标记也没有删除干净,还会留下一些多余的“:”、“-->”和“,”等。
二、在上面执行的结果之上想要把中英文分别提取出来,请执行如下操作:
1、CTRL+F打开查找窗口;
2、查找内容:<[a-zA-Z]@*^13
3、钩上“使用通配符”(可能需要单击“高级”展开完整的查找窗口);
4、钩上“突出显示所有在该范围找到的项目”,然后在下拉框里面选中“主文档”,单击“查找全部”;
5、关闭查找窗口,检查文档中的英文是否已经被全部选中了;
6、键入CTRL+X剪切所有选中的英文到剪贴板;
7、CTRL+N新建一个文档,键入CTRL+V把剪贴板上的英文粘贴过去;
8、现在就有了两个文档,一个全部是中文,另一个全部是英文。
请注意,我上面的全部操作步骤都是针对Word 2003的,如果楼主使用的是2007的话,需要做一些调整。主要的区别在于:
* “高级”按钮变成了“更多”
* 二4中的步骤改为:单击“在以下项中查找-主文档”。
其余步骤类似。
________________________________________
补充:
一、如果句子都太短,导致页面右方出现大面积空白的话,是否可以考虑对整个文档做个分栏操作?分成两栏后,右面的空白部分就可以利用上了。估计是可以节省一点纸张的。
二、去除空白行:
1、CTRL+H打开替换窗口;
2、查找内容:^p^p
3、替换为:^p
4、不要钩“使用通配符”;
5、连续执行几次“全部替换”,直到所有的空行被删除。
三、自动在句末添加标点:请问这个的具体要求是什么?在哪个句末加标点?加什么标点?
四、“自动排版”?——抱歉我不太明白这个是什么意思……
此外,如果楼主还有进一步的问题的话,可以直接HI我或者发百度消息。因为这里补充回答好象有次数限制,补充几次之后就不能再改了。
全部回答
- 1楼网友:过活
- 2021-04-08 23:59
不清楚你的文字排版方式,可以用录制宏来实现吧。假设你的文字是这样排的:
897
01:44:31,348 --> 01:44:34,599
我们的行为代价昂贵
The cost of our actions is high.
897
01:44:31,348 --> 01:44:34,599
我们的行为代价昂贵
The cost of our actions is high.
897
01:44:31,348 --> 01:44:34,599
我们的行为代价昂贵
The cost of our actions is high.
……
格式都一样,我这里重复了3次。只是要删除897一行和下面的一行。操作步骤如下:
1、把光标点到第一行的开头。
2、点word中的工具——宏——录制新宏——指定个快捷键——按shift不放,按向下光标键两次,点编辑里的剪切吧。再按光标键向下两次(这是为了重复时跳过你要留下的内容)。
3、停止录制宏。
4、点工具——宏——宏——选择你录制的宏——编辑。在代码前加上:for i=1 to 3 在最后end前一行加上 next。意思就是重复执行你的宏代码。
5、关闭宏,运行。这样就删除了你不要的两行了。如果你有1000次这样的重复,可以把to后改成1000。
如何把英文和中文分开呢?也可以按上面这个思路利用宏来完成。不知对你是否有所帮助。
- 2楼网友:鱼忧
- 2021-04-08 22:33
编辑——替换,调出替换窗口,点击下面的“高级”,打开更多工具。
把光标点放进“查找内容”,点开下面的“特殊字符”,再点“任意数字”;然后把“替换内容”留空,什么都不输入。再点“全部替换”。
ok!
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
推荐资讯