Schema theorems are descriptions of how the number (or the fraction) of members of the population be-longing to a schema varies over time in evolutionary computation. This paper gives full summarization of the advancesin Genetic Programming exact schema theorems in recent years ,mainly discusses the exact formulation for the expect-ed number of instances of a schema at the next generation in terms of microscopic and macroscopic quantities,then,the effects and the mechanisms of schema creation are clarified.
一、引言随着数据库技术和机器学习技术的发展,在数据库中发现新颖的、具有潜在效用的知识,简称KDD(Knowledge Discovery in Database)是近年来的一个新兴研究领域。KDD中的关联规则是描述数据库中数据项(属性,变量)之间所存在的(潜在)关系的规则。我们作如下形式化定义: 令I={i1,i2……,im}为项目集(itemset),D为事务数据库,其中每个事务T是一个项目子集(TI),并具有一个唯一的标识符ID。关联规则是形如XY的逻辑蕴含式,其中XT,YT,且X∩Y=φ。有两个因子与这条规则相关;如果事务数据库中有s%的事务包含X∪Y,那么我们说关联规则XY的支持度(support)为s;如果事务数据库里包含X的事务中有c%的事务同时也包含Y,那么我们说关联规则XY的置信度(confidence)为c。