A JavaScript Fancier

伟大的javascript技术研究中...

  IT博客 :: 首页 :: 新随笔 :: 联系 :: 聚合  :: 管理 ::
  304 随笔 :: 0 文章 :: 479 评论 :: 0 Trackbacks

再网上发现有人用vbscript正则表达式实现了这个功能,但代码很厂,偶改成js的了,很短的一段代码:


这里的关键是汉字escape后的编码范围是\u4e00-\u9fa5,知道这个问题就好解决了。

posted on 2006-06-28 18:14 Yemoo'S JS Blog 阅读(5387) 评论(3)  编辑 收藏 引用 所属分类: javascript个人作品正则表达式专题

评论

# re: JS正则表达式提取字符串中所有汉字 2007-02-04 01:54 杂耍大扫除htmdfghdfhg 
怎样从一个Html页面中提取所有汉字呢?不能有其它Html代码  回复  更多评论
  

# re: JS正则表达式提取字符串中所有汉字 2007-02-04 10:35 Yemoo'S JS Blog
原理相同,只是需要读取页面的html代码:
1.读取本页面的汉字方法:
==========================================
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title> new document </title>
<meta name="generator" content="editplus" />
<meta name="author" content="" />
<meta name="keywords" content="" />
<meta name="description" content="" />
</head>

<body>
汉字汉字
<input type="button" value="显示页面所有汉字" onclick='alert(document.documentElement.innerHTML.replace(/[^\u4e00-\u9fa5]/gi,""))'>

<a href="" title="">超级链接</a>
<p>段落标记</p>
</body>
</html>
==========================================
2.读取其他网页中的汉字,现使用xmlhttp获取数据然后使用同样的方法replace()即可。  回复  更多评论
  

# re: JS正则表达式提取字符串中所有汉字 2008-11-06 19:14 yangtse
\u4e00-\u9fa5
你说的这个范围是错误的
不信你试试等于号
也当作汉字处理了
  回复  更多评论
  

只有注册用户登录后才能发表评论。