`
cwsot
  • 浏览: 14779 次
  • 性别: Icon_minigender_2
  • 来自: 大连
最近访客 更多访客>>
社区版块
存档分类
最新评论

Python中正则表达式对中文的匹配问题

阅读更多

  今天在用python匹配中文的时候出了问题,要么匹配不到,要么乱码,搜索了一下,成功完成,写了一小段测试代码如下: import re source = "s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3" temp = source.decode('utf8') xx=u"([\u4e00-\u9fa5]+)" pattern = re.compile(xx) results = pattern.findall(temp) for result in results : print result   其中source为非unicode编码,要先将其转为unicode编码的temp
  然后写正则表达式xx,其中u的前缀表示正则表达式也要为unicode编码,因为正则表达式要和被匹配的文本使用同样编码
  unicode中中文的编码为\u4e00-\u9fa5
  调用匹配后直接便可打印出正确文字,此时返回的结果也为unicode编码
分享到:
评论

相关推荐

    python中正则表达式与模式匹配

    在之前找工作过程中,面试时经常被问到会不会python,懂不懂正则表达式。这篇文章主要介绍了python中正则表达式与模式匹配,需要的朋友可以参考下

    python中正则表达式 re.findall 用法

    Python 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。...本文主要给大家介绍python中正则表达式 re.findall 用法,具体内容如下所示; 在python中,

    Python中正则表达式详解

    正则表达式在python中运用的非常多,因为他可以进行任意的匹配,可以匹配我们想要提取的信息。当我们接触正则的时候你就会知道正则的强大。正则有一个库re 在一些工程中我们会经常调用正则的库来做与匹配相关的问题...

    Python中正则表达式的用法实例汇总

    正则表达式是Python程序设计中非常实用的功能,本文就常用的正则表达式做一汇总,供大家参考之用。具体如下: 一、字符串替换 1.替换所有匹配的子串 用newstring替换subject中所有与正则表达式regex匹配的子串 ...

    Python使用中文正则表达式匹配指定中文字符串的方法示例

    主要介绍了Python使用中文正则表达式匹配指定中文字符串的方法,结合实例形式分析了Python正则匹配及字符编码相关操作技巧,需要的朋友可以参考下

    Python中正则表达式的详细教程

    正则表达式是用来匹配字符串非常强大的工具,在其他编程语言中同样有正则表达式的概念,Python同样不例外,利用了正则表达式,我们想要从返回的页面内容提取出我们想要的内容就易如反掌了。  正则表达式的大致匹配...

    Python中正则表达式的巧妙使用一文包你必掌握正则

    对于需要匹配的字符串来说,同样把发现规律作为第一步,本文主要使用正则表达式完成字符串的查询匹配、替换匹配和分割匹配。 常用的正则符号 在进入字符串的匹配之前,先来了解一下都有哪些常用的正则符号,见下表...

    python中正则表达式的使用方法

    本文主要关于python的正则表达式的符号与方法。 findall: 找寻所有匹配,返回所有组合的列表 search: 找寻第一个匹配并返回 sub: 替换符合规律的内容,并返回替换后的内容 .:匹配除了换行符以外的任意字符 a = 'xy...

    Python中正则表达式小结

    注意:本文基于Python2.4完成;如果看到不明白的词汇请记得百度谷歌或维基,whatever。 1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分。...下图展示了使用正则表达式进行匹配的流程: 正则表达式

    Java中正则表达式使用方法详解

    如果你曾经用过Perl或任何其他内建正则表达式支持的语言,你一定知道用正则表达式处理文本和匹配模式是多么简单。如果你不熟悉这个术语,那么“正则表达式”(Regular Expression)就是一个字符构成的串,它定义了一...

    Python正则表达式教程之三:贪婪/非贪婪特性

    之前已经简单介绍了Python正则表达式的基础与捕获,那么在这一篇文章里,我将总结一下正则表达式的贪婪/非贪婪特性。  贪婪 默认情况下,正则表达式将进行贪婪匹配。所谓“贪婪”,其实就是在多种长度的匹配字符串...

    Python中正则表达式的用法总结

    正则表达式很神奇啊 # -*- coding:utf-8 -*- import re def print_match_res(res): 打印匹配对象内容 if res is not None: print(res.group()) else: print(None) # 两种匹配方式: pattern=[A-Z][a-z]+ # 一...

    30分钟带你入门python正则表达式

    re模块是python中正则表达式的包 import re # result = re.match(, ) result = re.match('python', 'ipython is best') if not result: print("no") else: print(result.group(), result.groupdict(), result....

    Python中正则表达式match()、search()函数及match()和search()的区别详解

    match()和search()都是python中的正则匹配函数,那这两个函数有何区别呢? match()函数只检测RE是不是在string的开始位置匹配, search()会扫描整个string查找匹配, 也就是说match()只有在0位置匹配成功的话才有...

    Python正则表达式的七个使用范例详解

    作为一个概念而言,正则表达式对于Python来说并不是独有的。...我们有兴趣使用的Python中正则表达式的模块通常叫做‘re’。 >>> import re 1. Python中的原始类型字符串 Python编译器用‘\’(反斜杠)来表

    详解Python中正则匹配TAB及空格的小技巧

    主要介绍了详解Python中正则匹配TAB及空格的小技巧,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

    一文秒懂python正则表达式常用函数

    本文不过多展开正则表达式相关语法,仅简要 介绍 python中正则表达式常用函数及其使用方 法,以作快速查询浏览。   01 Re概览 Re模块是python的内置模块,提供了正则表达式在python中的所有用法,默认安装位置在...

Global site tag (gtag.js) - Google Analytics