1. 首页 > 知识问答

会员管理系统数据库设计新探:大数据库构建与优化方案(2025版)

作者:队长 日期:2024-12-15 14:28:11 点击数:

早期的数据库系统,经常采用某种编号,比如身份证号码,公司编号等等作为数据库表的 primary key。很快,大家就发现其中的不利之处。比如早期的医院管理系统,用身份证号码作为病人表的 primary key。第一,不是每个人都有身份证;第二,对于国外来的病人,不同国家的病人的证件号码并不见得没有重复。用身份证号码作为病人表的 primary key是一个非常糟糕的设计。考虑到没有医生或者护士会刻意去记这些号码,使用自增长 primary key是更好的设计。公司编号采用某种特定的编码方法,这也是早期的数据库系统常见的做法。它的缺点也显而易见:很容易出现像千年虫的软件问题,因为当初设计数据库表的时候设计的位数太短,导致系统使用几年后不能满足要求,只有修改程序才能继续使用。问题在于,任何人设计系统的时候,在预计某某编号多少位可以够用的时候,都存在预计不准的风险。而采用自增长 primary key则不存在这种问题。同样的道理,没有人可以去记这些号码。使用自增长 primary key另外一个原因是性能问题。略有编程常识的人都知道,数字大小比较比字符串大小比较要快得多。使用自增长 primary key可以大大地提高数据查找速度。

2.避免用复合主键(compound primary key)这主要还是因为性能问题。数据检索是要用到大量的 primary key值比较,只比较一个字段比比较多个字段快很多。使用单个 primary key从编程的角度也很有好处, sql语句中 where条件可以写更少的代码,这意味着出错的机会大大减少。

3.双主键双主键是指数据库表有两个字段,这两个字段独立成为主键,但又同时存在。数据库系统的双主键最早用在用户管理模块。最早的来源可能是参照操作系统的用户管理模块。操作系统的用户管理有两个独立的主键:操作系统自己自动生成的随机 ID(Linux, windows的 SID), login id。这两个 ID都必须是唯一的,不同的是,删除用户 test然后增加一个用户 test, SID不同,login id相同。采用双主键主要目的是为了防止删除后增加同样的 login id造成的混乱。比如销售经理 hellen本机共享文件给总经理 peter,一年后总经理离开公司,进来一个普通员工 peter,两个peter用同样的 login id,如果只用 login id作操作系统的用户管理主键,则存在漏洞:普通员工 peter可以访问原来只有总经理才能看的文件。操作系统自己自动生成的随机 ID一般情况下面用户是看不到的。双主键现在已经广泛用在各种数据库系统中,不限于用户管理系统。

4.以固定的数据库、表应付变化的客户需求这主要基于以下几个因素的考虑:

4.1大型 EPR系统的正常使用、维护需要软件厂商及其众多的合作伙伴共同给客户提供技术服务,包括大量的二次开发。如果用户在软件正常使用过程中需要增加新的表或者数据库,将给软件厂商及其众多的合作伙伴带来难题。

4.2软件升级的需要。没有一个软件能够让客户使用几十上百年不用升级的。软件升级往往涉及数据库表结构的改变。软件厂商会做额外的程序将早期版本软件的数据库数据升级到新的版本,但是对于用户使用过程中生成的表进行处理就比较为难。

4.3软件开发的需要。使用固定的数据库库表从开发、二次开发来说,更加容易。对于用户使用过程中生成的表,每次查找数据时都要先查表名,再找数据,比较麻烦。举例来说,早期的用友财务软件用 Access作数据库,每年建立一个新的数据库。很快,用户和用友公司都发现,跨年度数据分析很难做。因此这是一个不好的设计。在 ERP中,很少有不同的年度数据单独分开。所有年份的数据都在同一个表中。对于跨国公司甚至整个集团公司都用同一个 ERP系统的时候,所有公司的数据都在一起。这样的好处是数据分析比较容易做。现在大多数数据库系统都能做到在常数时间内返回一定量的数据。比如,Oracle数据库中,根据 primary key在 100万条数据中取 10条数据,与在1亿条数据中取 10条数据,时间相差并不多。

5.避免一次取数据库大量数据,取大量数据一定要用分页。这基本上是现在很多数据库系统设计的基本守则。ERP系统中超过 100万条数据的表很多,对于很多表中的任何一个,一次取所有的会导致数据库服务器长时间处于停滞状态,并且影响其它在线用户的系统响应速度。日常操作,在分页显示的情况下面,每次取得数据在 1-100之间,系统响应速度足够快,客户端基本没有特别长的停顿。这是比较理想的设计。这也是大型数据库系统往往用 ODBC, ADO等等通用的数据库联接组件而不用特定的速度较快的专用数据库联接组件的原因。因为系统瓶颈在于数据库( Database)方面(数据量大),而不在于客户端(客户端每次只取少量数据)。在 B/S数据库系统中,分页非常普遍。早期的数据库系统经常有客户端程序中一次性取大量数据做缓冲。现在已经不是特别需要了,主要原因有:

5.1数据库本身的缓冲技术大大提高。大部分数据库都会自动将常用的数据自动放在内存中缓冲,以提高性能。

该系统采用多级权限设置,能够根据操作员的工作岗位定义不同的权限和操作职能。整个系统分为商家登录平台和会员自助平台。

商家登录平台功能丰富,包括会员、存款、退款、换卡、停用、延期、升级,以及商品进销存、前台的销售及收银管理、折扣、积分、礼品、短信、统计报表、信息提醒和参数设置等。

会员自助平台则主要提供会员档案查询、各项记录查询、店铺显示、商品查看以及会员公告等功能。

系统支持短信发送功能,能够针对消费、存款、生日、礼品到期、计次消费、进出场设置以及商家促销活动自动发送短信内容。

该系统支持多种会员卡的使用,包括磁卡、条码卡、ID卡以及IC卡等。系统支持多种设备的使用,如磁卡刷卡机、条码扫描器、条码刷卡机、ID卡感应阅读器、M1卡读写器以及小票打印机等。

在系统设计方面,采用了自增长机制主要是出于性能考虑。早期的数据库系统常常采用某种编号,如身份证号码、公司编号等作为数据库表的主键。这种设计存在很多问题。例如,在医院管理系统中,使用身份证号码作为病人表的主键存在很多问题,不是每个人都有身份证,而且不同国家的病人的证件号码可能存在重复。使用自增长机制来生成主键是一个更好的设计选择。

公司编号采用特定的编码方法也是早期数据库系统的常见做法,但这种方法的缺点很明显,容易出现软件问题,如千年虫问题。当初设计的位数过短,可能导致系统使用几年后无法满足需求,需要修改程序才能继续使用。使用自增长机制则不存在这种问题。数字大小比较比字符串大小比较更快,使用自增长可以大大提高数据查找速度。

在数据库设计中,应避免使用复合主键,这主要是出于性能问题的考虑。数据检索需要进行大量的值比较,只比较一个字段比比较多个字段更快。使用单个字段作为主键从编程角度也很有好处,可以编写更少的sql语句代码,降低出错的机会。

双主键是指数据库表有两个字段独立成为主键,同时又同时存在。这一设计最早应用在用户管理模块,参考了操作系统的用户管理模块的设计。操作系统的用户管理有两个独立的主键:系统生成的随机ID和loginid。采用双主键的主要目的是为了防止删除后增加同样的loginid造成的混乱。例如,在文件共享场景中,如果只用loginid作为用户管理的唯一标识,可能存在安全隐患。系统生成的随机ID用户通常无法看到,双主键现在已经广泛用在各种数据库系统中。

为了满足变化的客户需求,应采用固定的数据库和表结构。这主要基于以下几个因素的考虑:大型EPR系统的正常使用和维护需要软件厂商及其合作伙伴提供技术服务,包括大量的二次开发;软件升级往往需要改变数据库表结构;软件开发和二次开发使用固定的数据库表更容易;跨年度或跨公司的数据分析需要整合不同年份或公司的数据,采用固定表结构更便于数据分析。

在数据库操作中,应避免一次取大量数据,一定要使用分页获取数据。这是现在很多数据库系统设计的基本守则。在ERP系统中,超过100万条数据的表很多,一次取所有数据可能导致数据库服务器长时间处于停滞状态,影响其他在线用户的系统响应速度。采用分页获取数据是一种更合理的设计选择。在分页显示的情况下,每次取得的数据量在1-100之间,这样系统响应速度足够快,客户端基本没有特别长的停顿。

这是比较理想的设计。因为系统瓶颈在于数据库(数据量大),而不在于客户端(客户端每次只取少量数据)。在B/S数据库系统中,分页是非常普遍的做法。

早期的数据库系统经常有客户端程序中一次性取大量数据做缓冲。现在已经不是特别需要了,主要原因有:

1. 数据库本身的缓冲技术大大提高。大部分数据库都会自动将常用的数据自动放在内存中缓冲,以提高性能。

2. 数据库联接组件的缓冲技术也在提高。包括ADO在内的一些数据库联接组件都会自动对数据结果集进行缓冲,并且效果不错。比较新颖的数据库联接组件,比如Hibernate也加入了一些数据结果集缓冲功能。

也有一些数据库联接组件没有对数据结果集进行缓冲,比如JDBCDriver。不过几年之内情况应该有所改观。也有些不太成功的数据缓冲,比如EJB中的实体Bean,性能就不尽如人意。可能是因为占用内存过多的缘故。

相对来说,今天的程序员写客户端数据缓冲,能够超过以上两个缓冲效果的,已经比较难了。


随便看看