avavavavav 发表于 2014-11-19 16:55:43

两招抠出网页受限文字

有时我们在上网浏览时,发现一些页面上的文字是不能复制的。无论你采用鼠标选择、快捷键拷贝、右键菜单命令等均无果。下面的两招可以轻松突破这个限制。
360 IE内核浏览器编辑法
这是一种操作比较简单的方法,是利用360安全浏览器5.x版的一个特别功能——网页编辑模式来实现的。360安全浏览器在6.0之后的版本中采用了谷歌内核,不再附带该功能。
使用360安全浏览器5.x版开启某个受限网页,当你用鼠标选择或键盘热键均无法选择复制网页内容的时候,点击浏览器菜单命令“查看→启用编辑模式”,这时的网页就变得可选择,你可以任意选择复制和粘贴其中的内容了(如图1)。

EmEditor源代码过滤处理
如果使用360安全浏览器6.X版或其他浏览器,软件没有提供网页编辑模式功能,怎么办?我们可以用大多数浏览器提供的一个通用功能——网页代码查看,结合文字处理软件EmEditor的强大替换功能来解决问题。
我们以一个网页为例(如图2),假设这是一个内容复制受限的网页,通过“查看→网页源代码”可以获得如图3所示的代码内容,从图中可见,我们要的内容也在其中,但中间夹杂着许多对我们无用的代码。下面我们就通过EmEditor的替换功能将这些无用代码过滤掉。


先用EmEditor打开这个代码文件,删除文件头处无用代码,然后用Ctrl+H热键启动EmEditor的查找替换窗口,在“查找”框中输入“
  ”,保持“替换为”框中无任何内容,点击“替换全部”按钮。再用同样办法将歌词行尾的“
”替换为无文字的空串,这样就可以获得纯净的歌词内容了(如图4)。

小提示:
上面这个例子比较简单,我们在处理时没有选择正则表达式选项便轻松完成了对无用代码的成批替换。而许多时候,我们获得的网页代码比较复杂,简单的查找替换无法一下完成替换任务。对于比较复杂的网页代码,可用EmEditor构造正则表达式来完成网页代码的过滤替换。正则表达式构造案例我刊办公软件栏目曾多次介绍过,大家可以参考。
          
页: [1]
查看完整版本: 两招抠出网页受限文字

邓州市,邓州网,邓州吧,邓州论坛,邓州门户网