Python 正则表达式匹配中文
# 测试匹配中文信息
def TestReChinese( ):
source = u” 数据结构模版—-单链表SimpleLinkList[带头结点&&面向对象设计思想](C语言实现)”
temp = source.decode(‘utf8’)
print “同时匹配中文英文”
print “————————–”
xx = u”([\w\W\u4e00-\u9fff]+)”
pattern = re.compile(xx)
results = pattern.findall(temp)
for result in results:
print result
print “————————–”
print
print
print “只匹配中文”
print “————————–”
xx = u”([\u4e00-\u9fff]+)”
pattern = re.compile(xx)
results = pattern.findall(temp)
for result in results:
print result
print “————————–”
if __name__ == “__main__” :
# 测试正则表达式
reload(sys)
sys.setdefaultencoding(“utf-8”)
TestReChinese( )