Google Urchin 提供了两个用于管理报告数据库可扩展性和精准度的选项,这两个选项是urchin数据处理和展示的重要控制节点:数据库表上限和内存使用目标。

数据库表上限

此选项使可以将庞大的网站数据量维持在合理的限度内。使用此选项,您可以限制单个 Urchin 报告数据库表中的记录数。如果任何数据库表中的记录数在一段内超出此上限,则超出部分的记录将合并显示在最后一条记录中(显示为“其他”,关于other的更多信息,请见《如何减少“其他”记录数据》)。数据库表上限越大,报告数据的精准度越高。Google建议为获得最佳性能,请使用不超过 100,000 的数值,实际对于大型网站而言,10万级的数据显示不够。因此该选项需要根据网站流量大小而设置。通常情况下,在未对站内页面URL做特定标记时,网站URL展示是出现other的主要部分,因此可以参照该邠常用数据量大小来设置。

内存使用目标

内存使用目标可以用来限制日志处理过程中可以分配的内存大小,Urchin 提供此选项来指定报告数据库可以占用的内存上限。对于大型网站来说,较大的内存空间可以提升性能,因为内存空间增大可以减少页面调换。默认设置是保守估计的,在系统可用物理内存充足的情况下,应设置较大的值。


当前,Urchin 支持报告数据库设置使用以下最大值:

32 位版本:
数据库表上限:<= 500000 条记录
内存使用目标:<= 1024 MB

64 位版本:
数据库表上限:<= 10000000 条记录
内存使用目标:<= 8192 MB

根据经验,服务器32G内存,普通情况下,配置文件并发数为50,峰值时100的条件下,设置4G内存基本可以满足运营需求。建议峰值时查看服务器内存使用率以了解内存使用情况。另外,需要考虑服务器其他软件内存占用情况,如数据库、系统环境等。



除非注明,本博客文章均为 数据研究与商业应用(TonySong) 原创.
转载请注明本文地址: http://www.searchmarketingart.com/google-urchin-database-settings.html