« 上一篇 | 下一篇»

利用 Vim 清除網頁隱藏亂碼

reic | 20 六月, 2007, 15:04 | Freeware , 軟體小技巧 | (1394 Reads)

建議使用有 檢視選取範圍原始碼 功能的瀏覽器。

筆者主要用 firefox ,於是用 firefox 介紹,IE  方法應該差不多。

  • 在想要 Copy  的地方,反白,選 檢視選取區域原始碼。
  • 將反白處的原始碼複製下來,貼到 vim 或 gvim 中。
  • 在 Vim 的 normal-mode 下,移到檔案最開頭。
  • 按 v 進入 visual mode,再按 G,反白全部文字。接著按下 gT ,會把全部結合成一行。
  • 接著按 : 進入命令列模式,以後的動作都會在命令模式下利用 regular expression 來完成。
  • %s:<br>::g   ==>把 <br> 清除
  • %s:<:\r<:g   ==>因為我是用 windows ,用 linux 請把 \r 換成 \n。突然會變成很多行。


前菜結束了,再來就是要清除隱藏亂碼

  • %s:<fon.*$::  ==>清掉利用 font 標籤的隱藏亂碼
  • %s:<spa.*$::  ==>清除利用 span 標籤的隱藏亂碼
  • %s:<.*[^>]>::  ==>清掉剩下的所有 html 的標籤
  • %s:^$\n::  ==>清掉空行

若是還有利用其它html 標籤來隱藏,請自行增加。這樣就完成了清除隱藏標籤的工作了。

而筆者不知道怎麼利用 vim 撰寫 script 或 macro 。如果你有經驗,也歡迎留言告訴我,或是留下網址讓筆者可以前去查詢。 

靜態連結網址 | 迴響 (0) | 引用 (0)
作者保留此著作部分權利, 採CC授權。
友善列印/Print  Add this post to Delicious.   Add this post to Hemidemi.  Add this post Yahoo My Web.  Add this post Google Bookmarks.  Add this post MyShare. 
發表迴響












:authimage



  

Comments