- 浏览: 14779 次
- 性别:
- 来自: 大连
最新评论
Python中正则表达式对中文的匹配问题
- 博客分类:
- 技术杂绘
今天在用python匹配中文的时候出了问题,要么匹配不到,要么乱码,搜索了一下,成功完成,写了一小段测试代码如下: import re source = "s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3" temp = source.decode('utf8') xx=u"([\u4e00-\u9fa5]+)" pattern = re.compile(xx) results = pattern.findall(temp) for result in results : print result 其中source为非unicode编码,要先将其转为unicode编码的temp
然后写正则表达式xx,其中u的前缀表示正则表达式也要为unicode编码,因为正则表达式要和被匹配的文本使用同样编码
unicode中中文的编码为\u4e00-\u9fa5
调用匹配后直接便可打印出正确文字,此时返回的结果也为unicode编码
发表评论
-
第二章:字符串和字符串处理
2012-07-06 09:51 7411. char(表示8位ANSI),wchar_t(表示1 ... -
有限状态机实现正则表达式
2012-07-06 09:37 2040最近在写语法分析 ... -
jsp页面换行输出
2012-07-06 09:30 1147if(skins != null){ Iterator i ... -
js注册验证
2012-07-05 20:44 572function getFocus() //设置用户名文本 ... -
自定义通用查询组件
2012-07-03 13:42 6631、 设计通用查询窗口,严格的说这是一个目前只适合数据库 ... -
Flex 数据易犯错误: 常见误用和错误
2012-07-02 10:23 516在某些情形下,绑定操作似乎不能正常工作,此时你可能非常懊恼 ... -
Flex3 做界面与 VC交互
2012-07-02 10:22 670Flex3 代码 width="400&quo ... -
页面中嵌入FLEX应用-传参
2012-07-02 10:22 611项目需要在页面的某div中动态展现图表数据,最终选用FLE ... -
engine introduce
2012-07-02 09:43 476... -
Flex Spring整合包
2012-07-01 09:41 695Adobe Flex是一套创建富客户端应用(RIAs)的框 ... -
Flex 导出文件通用处理
2012-07-01 09:41 859本文 ... -
myeclipse6.5+flex 3 + tomcat6.0 + ds-console.war环境搭建
2012-07-01 09:41 372安装环境:myeclipse6 ... -
The architecture of Flex and Java applications two (Flex 和 Java 应用程序架构 2)
2012-07-01 09:41 508Flex and Java application ... -
Flex4+Spring3+Hibernate3+BlazeDS整合笔记
2012-07-01 09:41 556普通Java Web工程流行使用ssh框架,而当前台使用F ... -
PHP发送邮件乱码的具体解决方法
2012-06-30 17:57 835【转自】http://doc.chinaunix.net/ ... -
ASP.NET 使用alert弹出对话框后,CSS样式失效,字体变大的解决方法
2012-06-30 17:57 984ASP.NET 使用alert弹出对话框后,CSS样式 ... -
windows 7 下安装Oracle 9i 解决方法
2012-06-30 17:57 1249这里首先申明下,windows7下安装oracle9i 9 ... -
sql server 2000的一些问题解决方法
2012-06-30 17:57 567我机器上SQL Server 2000的sa密码因为长时间 ...
相关推荐
在之前找工作过程中,面试时经常被问到会不会python,懂不懂正则表达式。这篇文章主要介绍了python中正则表达式与模式匹配,需要的朋友可以参考下
Python 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。...本文主要给大家介绍python中正则表达式 re.findall 用法,具体内容如下所示; 在python中,
正则表达式在python中运用的非常多,因为他可以进行任意的匹配,可以匹配我们想要提取的信息。当我们接触正则的时候你就会知道正则的强大。正则有一个库re 在一些工程中我们会经常调用正则的库来做与匹配相关的问题...
正则表达式是Python程序设计中非常实用的功能,本文就常用的正则表达式做一汇总,供大家参考之用。具体如下: 一、字符串替换 1.替换所有匹配的子串 用newstring替换subject中所有与正则表达式regex匹配的子串 ...
主要介绍了Python使用中文正则表达式匹配指定中文字符串的方法,结合实例形式分析了Python正则匹配及字符编码相关操作技巧,需要的朋友可以参考下
正则表达式是用来匹配字符串非常强大的工具,在其他编程语言中同样有正则表达式的概念,Python同样不例外,利用了正则表达式,我们想要从返回的页面内容提取出我们想要的内容就易如反掌了。 正则表达式的大致匹配...
对于需要匹配的字符串来说,同样把发现规律作为第一步,本文主要使用正则表达式完成字符串的查询匹配、替换匹配和分割匹配。 常用的正则符号 在进入字符串的匹配之前,先来了解一下都有哪些常用的正则符号,见下表...
本文主要关于python的正则表达式的符号与方法。 findall: 找寻所有匹配,返回所有组合的列表 search: 找寻第一个匹配并返回 sub: 替换符合规律的内容,并返回替换后的内容 .:匹配除了换行符以外的任意字符 a = 'xy...
注意:本文基于Python2.4完成;如果看到不明白的词汇请记得百度谷歌或维基,whatever。 1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分。...下图展示了使用正则表达式进行匹配的流程: 正则表达式
如果你曾经用过Perl或任何其他内建正则表达式支持的语言,你一定知道用正则表达式处理文本和匹配模式是多么简单。如果你不熟悉这个术语,那么“正则表达式”(Regular Expression)就是一个字符构成的串,它定义了一...
之前已经简单介绍了Python正则表达式的基础与捕获,那么在这一篇文章里,我将总结一下正则表达式的贪婪/非贪婪特性。 贪婪 默认情况下,正则表达式将进行贪婪匹配。所谓“贪婪”,其实就是在多种长度的匹配字符串...
正则表达式很神奇啊 # -*- coding:utf-8 -*- import re def print_match_res(res): 打印匹配对象内容 if res is not None: print(res.group()) else: print(None) # 两种匹配方式: pattern=[A-Z][a-z]+ # 一...
re模块是python中正则表达式的包 import re # result = re.match(, ) result = re.match('python', 'ipython is best') if not result: print("no") else: print(result.group(), result.groupdict(), result....
match()和search()都是python中的正则匹配函数,那这两个函数有何区别呢? match()函数只检测RE是不是在string的开始位置匹配, search()会扫描整个string查找匹配, 也就是说match()只有在0位置匹配成功的话才有...
作为一个概念而言,正则表达式对于Python来说并不是独有的。...我们有兴趣使用的Python中正则表达式的模块通常叫做‘re’。 >>> import re 1. Python中的原始类型字符串 Python编译器用‘\’(反斜杠)来表
主要介绍了详解Python中正则匹配TAB及空格的小技巧,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
本文不过多展开正则表达式相关语法,仅简要 介绍 python中正则表达式常用函数及其使用方 法,以作快速查询浏览。 01 Re概览 Re模块是python的内置模块,提供了正则表达式在python中的所有用法,默认安装位置在...