Wednesday, January 14, 2009

http://www.itpub.net/viewthread.php?tid=1089050&extra=page%3D1%26amp%3Bfilter%3Ddigest&page=5
我只探讨具体技术问题,和主题无关,不关心rac适合oltp还是olap的讨论。
对数据库目前关心的是把 olap放到 greenplum 或者hadoop上,oltp拆分放到 mysql上。
对系统关心的是如何提高资源利用率和降低成本上。
对团队关心的是如何不断的提高
对技术部门关心的是如何让创新的想法和行动成为一种常态。
……

努力中……

http://www.itpub.net/viewthread.php?tid=1089050&extra=page%3D1%26amp%3Bfilter%3Ddigest&page=16
#155
刚跟平台技术部的人沟通了下我们的想法和规划。
不光要解决oracle之间的和数据同步,将来还要解决和mysql之间的同步,解决跟memcache系统之间的数据刷新
这种东西么,先满足内部需要,然后逐步产品化,也是一个比较稳的路子


http://www.itpub.net/viewthread.php?tid=1089050&extra=page%3D1%26amp%3Bfilter%3Ddigest&page=16
#160
cache有很多层面,在数据库之外,几年以前就存在着 ldap、memcache、search engine 这些东西,只是后来去掉了ldap放到数据库中,又把移到 数据库中的这部分放到了自己改造的memcache中。

总之,一个大型网站的背后,实际上使用到的技术是很多的,结构也可能是很复杂的。 技术的进步,不过是在不同的时期做不同的排列组合,适当的引入新鲜的东西进来。



< 原帖由 renegadeYanni 于 2008-11-24 08:54 发表
< 阿里有没有负责开发这类通用软件的部门?我对这方面的开发很感兴趣哦。
现在有整合的平台技术部,负责平台通用技术的开发


http://www.itpub.net/viewthread.php?tid=1089050&extra=page%3D1%26amp%3Bfilter%3Ddigest&page=13

由于数据仓库的需求相对比较简单,目前我们只需要部分大表,不够适时解析和直接应用作为产品考虑的问题多。并且目前仅仅对归档日志进行解析(lag time 5分钟),批量测试100g 日志的时间在 30分钟左右,这样计算下来我只能说批量分析获取部分表的数据可以达到 50MB/S 。

但要做成 适时解析 redo log的极限是多少我还不清楚,还没正式测试这个,毕竟这个跟分析结果写磁盘或者入队列还有很大关系,这个数字我不能保证。 btw,目前在 aix上测试的,解析进程允许使用 3g 内存。


http://www.itpub.net/viewthread.php?tid=1089050&extra=page%3D1%26amp%3Bfilter%3Ddigest&page=12
ibm 卖cpu的数量就是按照核计算的。因为p590是一块板 8个核,就是计算8个cpu卖
跟 intel cpu不是一样的。

http://www.itpub.net/viewthread.php?tid=1089050&extra=page%3D1%26amp%3Bfilter%3Ddigest&page=6
ebay在 f5 分析url规则来转发 + shareplex 同步 是成功的,但这个也要再架构层面布局做好基础,现有的比较复杂的系统要去改造成本还是蛮大的。就我们现在的情况而言,如果要在 rac 的intance之间分割应用,其实不困难的,因为只要分割主要的压力大但关联少的应用就可以了。但没下这个决定的原因也是多方面的,毕竟比如 4c core 的 pc,4个节点,那么license数量就是 4*4/2*4*1.75=56个。这样的软件成本其实也蛮高的了。 而如果是 p590,16c的 590的license是 16*0.75*1.25=15,那么license数量差异是 41个(费用上有多少大家心里就有数了)。 而基本上以前我们会认为4个pc server的rac 不会强于一台 16c的 590 的 oltp能力。 一台 16c的 590 的价格大约在 280万左右。 所以以前在 oltp上采用了 ibm小型机这样的策略,毕竟风险也低一些。

但是未来 p590 满足不了需要,必须要分割,既然分割,那么就没必要依赖小型机了。

你可以尝试一下 like 这样的字符串函数看看,或者再pl/sql自己写个函数.
当然,我这么说,只是表明, cpu、内存、io 都可能在不同的场景下成为瓶颈。 不要理解为 cpu是瓶颈io不是瓶颈。

http://www.itpub.net/viewthread.php?tid=1089050&extra=page%3D1%26amp%3Bfilter%3Ddigest&page=5
BTW: 我只探讨具体技术问题,和主题无关,不关心rac适合oltp还是olap的讨论。 对数据库目前关心的是把 olap放到 greenplum 或者hadoop上,oltp拆分放到 mysql上。 对系统关心的是如何提高资源利用率和降低成本上。

No comments: