20、与单模式匹配相比,多模式匹配的优点是什么?
与淡漠是匹配相比,多模式匹配的优势在于一趟遍历可以对多个模式进行匹配,对于单模式匹配算法来说,如果要匹配多个模式,那么有几个模式就要进行几趟遍历,这样效率太低。多模式匹配大大提高多模式匹配的效率。同时,多模式匹配算法也适用于单模式情况。
21、简单介绍垃圾邮件系统的处理过程。
1) 收集大量的垃圾邮件和非垃圾邮件,建立垃圾邮件集和非垃圾邮件集。
2) 主要考察邮件的四个特征:域、发件人、关键字、附件。通过提取邮件上述四个特征。参考四个主要特征,可以采取垃圾邮件过滤技术,大致可分为内容过滤、接入过滤和行为过滤这三类技术。
内容过滤就是对邮件内容进行内容匹配,其中关键字技术用某些限定条件对邮件主题进行审查过滤。摘取关键词进行分析过滤,或是统计垃圾邮件的相关特征,输入反垃圾邮件引擎,使升级后的反垃圾邮件软件能够拒收这些邮件。为了及时获得有效特征,还可以设立专门的“诱饵邮箱”,只要有垃圾邮件进入自己的网站,这个诱饵邮箱就会自动截获,供专门技术人员参考。常见的规则方法为关键词过滤、决策树过滤等。近年来,研究学者将贝叶斯力理论、合作理论引入内容过滤领域,为垃圾邮件过滤技术注入了新的动力。
接入过滤是通过对邮件信头部分进行检查,可以提前发现或阻断非法信息,且不侵犯个人隐私。可以分为打补丁的方法和修改协议的方法两类。前者针对现有邮件协议缺点提出补救措施,以增强邮件系统的安全性;后者多为企业界提出的方案,其实现需要改变电子邮件系统的工作方式。
行为过滤依据合法邮件是在社会关系驱动下,以交换信息为目的、双向通信的结果;而垃圾邮件是在发送者利益驱动下,一大范围扩散为目的、单向通信的产物。垃圾邮件和合法邮件本质上的不同必然导致其行为的显著差异,因此两者从行为特征上看是可以区分的。从2003年起,学术界开始从流量特征入手,对邮件协议行为进行深入研究。研究可分为基于统计的方法和基于拓扑的方法两种。
3)通过垃圾邮件过滤技术对邮件进行识别。识别后正常邮件直接发送到目的地。ISP服务商或客户端对垃圾邮件通过截断等方式阻止垃圾邮件的传播。
现阶段垃圾邮件过滤技术,经历一下几个发展阶段:
第一代反垃圾邮件技术。很难明显的区分在大多数MTA上已经具有的反垃圾邮件功能和第一代反垃圾邮件产品功能,因为这些已经存在的反垃圾邮件功能加上新开发的功能在很大程度上帮助解决了垃圾邮件问题。标题和信头测试,和简单的DNS测试一样,主要是由于需要抵制垃圾邮件来推动的。
第二代反垃圾邮件技术。即时黑名单和电子签名,不是为了反垃圾邮件而把现有的MTA技术简单的重复或者延伸,它们的存在完全为了制止垃圾邮件和对先前的技术进行改良。
第三代反垃圾邮件技术。用鉴别垃圾邮件(签名)和即时黑名单(RBLs)的方法来抵御垃圾邮件注定失败。垃圾邮件发送者能够轻易的绕过即时黑名单,最好的电子签名技术也无法达到百分之百的正确率。互联网和软件行业大约于2002年出现了一项全新的技术。
第四代反垃圾邮件技术。垃圾邮件的存在有部分原因是由于在SMTP创造之初,只是用于学校,政府和军队,因为是一个封闭的系统,所以不存在非法使用和电子邮件的滥用。1990年起,互联网广泛的应用于商业,但是之前的技术隐患仍然存在。垃圾邮件和反垃圾邮件活动必将长期存在,经过了十几年的发展,新兴的反垃圾邮件技术也层出不穷。但无论哪一种技术,都无法完全应对多变的垃圾邮件。因此,第四代反垃圾邮件技术偏向于采用一个全面包含最有效垃圾邮件阻断技术的整体解决方案。
最简单的方式是使用正则表达式。检测邮箱格式的正则表达式:^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$。
1、标准的C和C++都不支持正则表达式,但有一些函数库可以辅助C/C++程序员完成这一功能,其中最著名的当数Philip Hazel的Perl-Compatible Regular Expression库,许多Linux发行版本都带有这个函数库。
2、C/C++ 中使用正则表达式一般分为三步:
1)编译正则表达式 regcomp()
int regcomp (regex_t *compiled, const char *pattern, int cflags)
这个函数把指定的正则表达式pattern编译成一种特定的数据格式compiled,这样可以使匹配更有效。函数regexec 会使用这个数据在目标文本串中进行模式匹配。执行成功返回0。
2)匹配正则表达式 regexec()
int regexec (regex_t *compiled, char *string, size_t nmatch, regmatch_t matchptr [], int eflags)
当编译好正则表达式后,就可以用regexec 匹配我们的目标文本串了,如果在编译正则表达式的时候没有指定cflags的参数为REG_NEWLINE,则默认情况下是忽略换行符的,也就是把整个文本串当作一个字符串处理。执行成功返回0。
3)释放正则表达式 regfree()
void regfree (regex_t *compiled)
当使用完编译好的正则表达式后,或者要重新编译其他正则表达式的时候,可以用这个函数清空compiled指向的regex_t结构体的内容。请注意,如果是重新编译的话,一定要先清空regex_t结构体。
自认比较没有纰漏的正则表达式:^[a-zA-Z0-9]([a-zA-Z0-9]*[-_\\.]?[a-zA-Z0-9]+)*@[a-zA-Z0-9]+\\.[a-zA-Z0-9]+
示例代码——
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class EMailAddrTester {
public static void main(String[] args) {
Pattern p = Pattern.compile("^[a-zA-Z0-9]([a-zA-Z0-9]*[-_\\.]?[a-zA-Z0-9]+)*@[a-zA-Z0-9]+\\.[a-zA-Z0-9]+");
Matcher m = p.matcher("zhidao@baidu.com");
System.out.println(m.matches());
}
}
合法E-mail地址:
1.
必须包含一个并且只有一个符号“@”
2.
第一个字符不得是“@”或者“.”
3.
不允许出现“@.”或者.@
4.
结尾不得是字符“@”或者“.”
5.
允许“@”前的字符中出现“+”
6.
不允许“+”在最前面,或者“+@”
正则表达式如下:
-----------------------------------------------------------------------
^(\w+((-\w+)|(\.\w+))*)\+\w+((-\w+)|(\.\w+))*\@[A-Za-z0-9]+((\.|-)[A-Za-z0-9]+)*\.[A-Za-z0-9]+$
-----------------------------------------------------------------------
字符描述:
^
:匹配输入的开始位置。
\:将下一个字符标记为特殊字符或字面值。
*
:匹配前一个字符零次或几次。
+
:匹配前一个字符一次或多次。
(pattern)
与模式匹配并记住匹配。
x|y:匹配
x
或
y。
[a-z]
:表示某个范围内的字符。与指定区间内的任何字符匹配。
\w
:与任何单词字符匹配,包括下划线。
$
:匹配输入的结尾。
1、打开Foxmail客户端软件,点击“工具”菜单中的“帐号管理”;
2、进入帐号管理页面后,点击左下角的“新建...”;
3、进入Foxmail新建帐号向导后输入您的“电子邮件地址”后点击“下一步”;
4、在此页面选择您新建邮箱的类型(即接收服务器类型),输入“密码”和“帐号描述”后点“下一步”;
5、系统会根据您上步所选的邮箱类型自动匹配对应的接收和发送服务器地址,您只需确认“服务器类型”及“端口号”无误后点击“完成”即可;
邮件群发是一种很棒的推广营销方式,下面是一米软件的智能QQ邮件群发软件,你可以了解一下。
1,QQ直接弹窗提示:QQ收件箱直接弹窗提示收到邮件,提醒用户第一时间查看。
2,QQ邮件图片直接显示:QQ邮件中的图片直接显示,无需点击查看。
3,无视邮件内容屏蔽规则:智能干扰加密算法大大提高进箱率。
4,多模式换IP发送:支持动态vps拨号发送,动态移动IP池发送等(自主研发)。
5,集成多种方式发送:支持smtp/网页协议方式发送等。
6,支持任意邮箱发送:可任意配置邮箱发送,企业邮箱及小号等,默认配置6种以上邮箱发送。
7,精准抓取QQ邮箱:可根据年龄,性别,地区,是否在线等条件抓取QQ邮箱。
8,批量提取群成员QQ邮箱:可批量提取所有群成员的QQ号及邮箱。
9,自动过滤无用QQ邮箱:可自动识别过滤未开通邮箱或小号QQ邮箱,保证群发准确性。
圾邮件技术也层出不穷。但无论哪一种技术,都无法完全应对多变的垃圾邮件。因此,第四代反垃圾邮件技术偏向于采用一个全面包含最有效垃圾邮件阻断技术的整体解决方案。如何用c语言来识别电子邮箱是否正确最简单的方式是使用正则表达式。检测邮箱格式的正则
式,怎么写?合法E-mail地址:1.必须包含一个并且只有一个符号“@”2.第一个字符不得是“@”或者“.”3.不允许出现“@.”或者.@4.结尾不得是字符“@”或者“.”5.允许“@”前的字符中出现“+”6.不允许“+”
是用于学校,政府和军队,因为是一个封闭的系统,所以不存在非法使用和电子邮件的滥用。1990年起,互联网广泛的应用于商业,但是之前的技术隐患仍然存在。垃圾邮件和反垃圾邮件活动必将长期存在,经过了十几年的发展,新兴的反垃圾邮
有邮件协议缺点提出补救措施,以增强邮件系统的安全性;后者多为企业界提出的方案,其实现需要改变电子邮件系统的工作方式。行为过滤依据合法邮件是在社会关系驱动下,以交换信息为目的、双向通信的结果;而垃圾邮件是在发送者利益驱动下,一大范围扩散为目的、单向通信的
或者“.”5.允许“@”前的字符中出现“+”6.不允许“+”在最前面,或者“+@”正则表达式如下:-----------------------------------------------------