2010年6月27日星期日

关于经济和博弈的几个有趣的问题

    这次去cpug的聚会,大家在会上提到了经济和博弈,两者其实非常有关系。正好也谈到了世博,顺便讲一下上面的几个观点。
1.排队模型
    世博的情况大家很清楚咯,每个人给定入场费,场馆需要排队,一天内无限制观展。那么,谁会去看世博,谁会排队?
    从价格成本上说,排队其实是通过等待,限制了每个人能参观的场次,增加了每场参观的成本。而从隐形成本上说,上面的价格还得加上你一天的时间,而且你还要为排队付出额外的体力。
    我们先考虑,假如票价是零,体力成本忽略不计,谁会排队。这时候,你的唯一成本就是时间的消耗。很明显,时间成本越低的排的越高兴。让一个每天赚10W的首富和街道老太太比排队还不如杀了他。那么,160的入场费带来了什么?限定了入场的人要有基础消费能力,简单来说就是有能力进行娱乐消费。那么综合上面两点,最喜欢排队的是时间成本为零的,有基础消费能力的人。例如子女有点钱的退休老人,父母还不错的考生,还有部门还不错的政府官员——当然,最后一个无需排队。
    其次,我们再考虑谁去看世博。
    去看世博的人越多,排队就越多——这是理所当然的。排队越多,每张票上能看到的内容就越少,这算是某个变相的市场机制,限制世博的入场。会去看世博的人,一定是觉得所获得的游览内容大于160元加上一天时间的人——这排除了穷人,有钱人(概率上的,因为通常有钱人的时间成本都很高)。世博是一个针对中产阶级的展览。
2.火车票逻辑
    关于火车票的一个经典逻辑就是,要么涨价,要么实名制,要么产生黑市。
    同样,这个逻辑应用于世博的结论是,对于热门场馆,要么差别涨价,要么实名排队,要么有人卖队号。
    由于现有状况,差别涨价已经没戏了。所以世博的管理者。千万记得派足够的志愿者拖走卖队号的人,否则绝对黄牛遍地。
    讽刺的是,如果有合法黄牛的存在,才会吸引有钱人来参观世博。因为他们的时间成本很高,没时间慢慢排队。而足够多的有钱人来参观,就容易带来投资——这更符合向世界展示上海的目的和上海人的利益。
3.信息的价值
    stun说了一点分析,周日夜场往往会比较空。我验证下来,至少在端午节假期的最后一天,这个是正确的。原因在于来上海参观的团体客,最后一天无论如何他们也要回去了。因此此时继续参观世博的只有长期滞留上海的游客和上海本地人,这毕竟会少很多。
    我说了一点对世博的不满,世博的场馆外都有需要排多少时间的告示,但是并没有信息化出来。如果信息化出来,就可以在很多地方展开交互式终端,指导人们哪个馆更值得排队。或者更进一步的,允许人手机查询。这是一个很有需求的业务。
    从市场意义上说,这些东西叫非完全市场。所谓完全市场,市场中的每个人都知道另一个人的信息。当然,完全充分市场,绝对理性人,理想共产主义并称三大笑话假定。然而,我们的信息越多,我们就越有优势。stun了解了某些信息,于是他可以在一个比较空闲的时间段入场,从而高质量的参观。(虽然是个意外,不过我们正好在这个时间入场了)而假定某个人了解了某个时刻世博排队信息,他就容易决定去哪个场馆,从而捡漏。越多的信息,越容易低买高卖。
    由此带来的是两方面的东西,一方面,我们每个人试图获得更多的信息,因此市场就更接近完全市场。另一方面,如果获得信息的成本相对较高,就一定会有信息的获得者来更加的提高这个门槛——这会增加他们的收益。例如房地产,信息的成本是惊人的高。如果你看到错误的房地产信息,会导致被骗很多钱,因此你需要从各个方面验证每条信息。作为信息的发出和接受者,我们会如何做?当然是尽力澄清这些信息,声明我们是真的买家和真的卖家,并且尽量发出和获得尽可能多的信息,例如使用多个中介网站,使用朋友网络等——这往往会获得意想不到的好东西。然而从中介角度来说,这会使得他们的价值迅速降低。因此他们经常做的事情是以个人名义发布卖出或者买入信息——当然是假的——来扰乱信息流,增加信息的获得成本。同样的事情也发生在人力资源市场上和婚介市场上。
    由此来看,GFW的门槛使得信息的价值足够高了么?看来没有。如果信息的门槛足够高,就会有人或组织放出国外的假消息来扰乱判断,从而保持他们手里真消息的价值——如同我们的邻居经常做的那样。这么来看,他们的信息门槛倒是够了。
4.价格-风险函数
    会上有个美女问了个问题,你们在什么风险下才能blahblahblah。我们当然知道她不是在寻求外遇——她在找创业程序员,django的。顺便说一句,如果有靠谱的php/python/django程序员,可以联系我,超多人狂求。
    我很快的指出了她这个问题的一个问题——你这个风险偏好问题,到底在什么价格下呢?
    函数想象一下,在一毛钱的时候,你更偏好于直接获得一毛钱呢?还是用1/10的概率赌一块。如果是100W,你更偏好直接获得呢?还是用1/10的概率赌1000W。我们定义,在某个成本下——例如一毛钱,你能接受以1/N的概率获得N倍的收益,同时你无法接受以1/(N+1)的概率获得N+1倍的收益,这个N就是风险阀值。当然,更精确的抽象定义中,N应当为实数,并且也不是N+1,而是N+dN,其中dN为无穷小量。很明显,风险阀值是成本的函数——而且往往是单调减函数——这叫做风险偏好函数。如果是1毛钱,很多人往往可以接受以100W分之一的概率去赌10W——或者更高。如果是100W,估计就没几个人这么干了。
    我们在价格为0的时候,风险偏好都是趋于无穷的。都不要钱了还怕什么呢?但是随着价格的升高,有些人风险偏好就迅速降低,而有些人则不变——后者我们称为经典赌徒。有个关键价格,风险阀值为1。当你的风险偏好为1的时候,事实上你拒绝一切风险。从财务上看,你单笔只能持有固定存款和国债。也就是说,如果你有这个价格以上的钱,并且是绝对理性人,你在这个以上级别的投资中绝对拒绝——因此我们称这个价格为投资中止上限。这是严重违反直觉的,从直觉上看,我们钱越多,越希望从事一些高收益的事情,获得更多的钱。不过你真的照做的话,倒是有希望瞬间成为穷光蛋。除非你眼光很好,否则收益最高的事情往往是风险最高的事情,除非你有特殊背景。
    作为对应这个风险偏好的方法,我们往往组合投资。组合投资中发生的事情并不是风险降低,而是单笔价格降低——这样你就觉得可以接受了。问题是,当你真的组合了足够多的投资,你得到的风险为0,而你的收益是多少——绝对严格等于国家标准利率。。。
    这也解释了赌徒为什么容易成功,他们风险偏好对于价格很不容易降低,因此投资中止上限很高。对于某些只有高投资才有大回报的事情,只有赌徒能赢走一切,普通人要这么做除非组合对冲风险,这是很困难的。当然,另一个因素是,如果一个赌徒没成功,往往就挂了,你也就没继续听到任何东西了。。。
5.赌球和买卖天气
    或许这章应该改叫对冲。当一个人对球队获胜概率和另一个人有差异的时候,他们就可以赌球。同样的事情也发生在天气上。如果一个人对天气的预期和另一个人有差异的时候,他们可以买卖天气——好像安然在出事前就在设计这个。
    例如,有某个人,我们叫Alice,如果明天天晴,她能赚150,如果下雨,赔50,她认为有75%概率下雨。而另一个人,我们称为Bob(安全人物哈,虽然这不是个安全问题),如果下雨,他能赚150,否则赔50,他认为有25%下雨。这样的假定很好,叫做对称假定,因此我们可以省掉庄家和赔率的问题。那么,Alice和Bob如何来让自己更心安理得呢?他们可以对赌,如果下雨,Bob给Alice100,反之,Alice给Bob100。我们来看变化。
    当Alice完成对赌协议前,她认为自己赚钱概率是150*0.25-50*0.75=0,而对赌后,她的赚钱概率是(150-50)*0.25+(-50+100)*0.75=50。而Bob呢?你们自己算吧,情况是一样的。
    当每个人都觉得别人的月亮更圆的时候,他们就可以买卖月亮,从而增加自己想像中的收益。其实呢?什么都没改变。这就叫对冲。
6.智猪博弈
    一个房间里有一头大猪和一头小猪,一个踏板操纵放出猪食。大猪踏了踏板,跑过去吃的时候,小猪会吃到给他剩一点。而小猪踏了踏板,跑过去的时候,大猪什么都不会给他剩下。
    这时候出现的有意思的事情是,那头小猪死也不会上踏板。因为小猪上了踏板,跑过去的时候大猪都吃光了,因此上踏板这个事情对它的收益是0。而对大猪而言,跑过去虽然少,还能吃到一点,因此上踏板这个事情对他的收益还是有的。在这种情况下,大猪比小猪更有动力上踏板。
    当然,这个故事也许还没有完。小猪吃了足够的东西变成大猪的时候,情况会如何变化?那是另一个故事了。

2010年6月24日星期四

世界上10个最受欢迎的Linux发行

    http://blog.sina.com.cn/s/blog_49f7fe790100j0hp.html
    个人意见是RHEL(Enterprise use), Debian(Enterprise use), Gentoo(All use), Fedora(Desktop use), Ubuntu(Desktop use), CentOS(Enterprise use), SuSE(Enterprise use), Mandriva, Knoppix, Arch。
    按照阵营可以分为Redhat系列(RHEL, Fedora, CentOS, Mandriva), DEB系列(Debian, Ubuntu, Knoppix), Gentoo系列(Gentoo), SuSE系列(SuSE), Arch系列(Arch)。
    按照包管理系统可以分为RPM和DEB两大主流系统,Redhat系列和SuSE系列使用RPM,DEB系列使用DEB,Gentoo和Arch是自己的包管理系统。
    另外插一句区别。Fedora是Redhat的社区版本,由社区维护,免费使用。当Fedora比较稳定了,就会出RHEL。RHEL是商业版本,由Redhat公司维护,收费的。而CentOS是使用RHEL的源码包(它必须提供)自行重编译的社区版本,和Fedora的区别在于CentOS的稳定度和维护状况更靠近RHEL。Debian和Ubuntu没有关系,Ubuntu使用了Debian的包管理系统不代表他们有关系。Ubuntu有自己的开发/管理计划,通常来说比Debian unstable更加激进,稳定性也不差。不过如果你需要稳定的商业级服务器,还是Debian更加靠谱点。
    另外,无论你认为哪个Linux更受欢迎,即使Debian中确实有FreeBSD kernel package,请别把BSD放进最受欢迎的linux发行中来。那个是Unix,Idiot。

--
无能者无所求,饱食而遨游,泛若不系之舟

2010年6月16日星期三

世博会观感

    昨天看了一下世博,仅浦西馆,发现问题非常多。当然,我没看完世博,很多问题有失偏驳。然而不得不说,整个世博看似热闹,其实差劲。
一,形同虚设的安保
    昨天安检速度很快,完全没有传说中的恐怖。但是通过安检后,我检查书包的时候发现一个�事——我把一罐水带了进去。我在想,如果是恐怖分子,带罐液体炸弹会比这个困难么?对于这种形同虚设的安检,对得起等待的观众么?不如直接撤掉。
二,布展内容不精彩
    昨天看了铁路馆,人保馆,城市最佳实践区,案例馆,通讯馆,船舶馆,另外打听了一下cisco。其中铁路馆,人保馆,城市最佳实践区基本不排队,但是很无聊,没有什么有意思的展品。以铁路馆为例,从上层走到下层就是一堆展板,上面写着各种宣传资料来忆苦思甜,有几个车站模型,有一个模拟铁路管控的大屏幕——也就这个有点新意。
    通讯馆,船舶馆,cisco都有一定的排队,这几个馆也没什么有意思的展品,主要就是放电影。3D电影,360度电影,4D电影,各种先进的电影技术组成了一堆——电影院。我估算了一下,电影院基本就是排队的理由。一次电影大约是10分钟,可容纳100-200人,平均6秒一个人。一天最长的有效布展时间是46800秒,一天也就能接待7800人。浦西大约是50个馆,一个人去一次至少看三个馆,这样算下来浦西的接待游客数极限是13W人。如果考虑时间和场馆的非平均性,安全的接待人数不到10W。外推到全站馆,每日安全接待人数30W上下。
    从内容来说,通讯馆是我最失望的一个馆,也许和我从事的行业有关。进门整了个ICT终端,但是完全没体现交互性,从头到尾就是作为第二显示屏来使用的。连最基础的投票的展示都没有做到,等于一个掌上电视。第六感这种超时代的Geek装置没出现就算了,最起码出现了两年以上的VR/AR技术应该有展示吧。也没有。
    感觉整个浦西,与其说是一个世界先进技术和理念的展会,不如说是一个大的展板通道和电影院——付费而且需要排长队。作为佐证的,昨天我在世博园浦西区没有见到几个外国人,全是中国人。这不是向世界展示中国的展览,而是中国人自娱自乐,外国人趁机赚钱的狂欢。
三,科技应用不充分
    这个问题涵盖整个世博,凸显了中国的特色和现状。照理说,世博是展示国家和城市科技和人文水准,展示自身实力的舞台。但是上海世博连最基本的,已经在中国广泛投入使用的一些技术都没有充分展示,实在是有亏盛名。
    首先是公共交通系统。世博的公共交通系统使用电力车,听起来很先进。但是车在哪里,还有多久来一辆,车上还能容纳多少人,一概不知道。杭州早在一年半到两年前已经运作了公交查询系统,在每个站牌上都可以看到下一辆车还有多远,需要多少时间。从理论上说,计算车体重量来推测车上有多少乘客也不是太难的事情。也许有人觉得世博筹办的时候早在4年前,杭州还未运作这个系统。然而根据贝壳的搜索,世博的车上是带RFID系统的,就是信息不对公众开放而已。这简直是恶意的故意。
    其次是RFID,沃尔玛已经大规模使用有源RFID进行盘货级管理,也算是已经工程级别应用了。即使考虑成本和人流问题,也可以在幼童或其他需要管控的对象身上戴上RFID设备。允许监护人通过短信精确定位人员位置。这个也没见着。
    最后是排队问题。目前排队区前有需要排队多久的告示,这是一个非常人性化的举措,然而还不够现代化。从技术上,自动计数每个排队区的人数,队伍的放行速度,从而精确计算当前排队时间是很简单的事情。将这些数据汇集到中央服务器上,就可以知道每个场馆的热门程度。同理,入园人数的和各个园区门的排队长度也不应当定时统计,实时统计并不是一个无法解决的工程问题。
    而地图服务已经是一个很大众化的服务了,对所有的游客提供全地图导航。如果有GPS还可以加入GPS全地图导航,并且以颜色显示场馆的热门程度,技术上有任何难度么?压力根本不是问题,可以使用多个缓存服务器以分钟级密度从主服务器同步数据,从而以冗余集群的方式提供超大规模服务。
    以上理念的实施完全没有任何技术上或者工程的难度,然而世博举办方完全没有考虑这些问题。反而是采用了白菜方案,就是一堆名为白菜的志愿者,来填充本应属于机器的问题,这充分凸显了中国的特色和现状。在人力资源太过便宜的中国,使用技术来替代人力,节约成本并为用户提供更好的服务是没有前途的。王道是进一步降低人力资源成本,使用更多的人来替代机器。反正从成本说,每个人都只是颗白菜而已。

2010年6月12日星期六

C10K的卡通解释

    以前有一帮医生,帮一个城市看病。当然,医生少人多,政府就开始动脑筋,怎么样让医生给更多的人看病。
    最开始是医生去病人那里看病的,医生花在路上的时间很长,于是成立了医院。让病人过来,节省医生的时间。当然,病人肯定比医生多的,这是整个文章的假定。为了保持原来的模式,病人到了医院后,会有自己独立的一间屋子,完全模拟在家的感觉。这样会有什么问题呢?问题在于病人独占了医生,在病人抽血,验血的时候,医生无所事事,因此效率很低。
    后来转换了一个模式,医生过一段时间就离开当前病人,看看哪个病人那里空着就过去。这样的目地是为了防止一个病人拉住医生不放,将医生的时间平均分配到多个病人头上。这样的动作快多了,但是医院受不了了。原本8个医生,一人一个病房。现在8个医生要在N间屋子里穿梭,万一每个屋子里的病人都是在抽血,那这个N就会无穷大了,现在是屋子不足了。
    然后又换了个模式,对不起,现在不是一人一间屋子了,是一堆人一间屋子。每个人只要一个床和一个病例记录,其他的设备可以有限的共享。这样屋子不足的问题得到了部分的缓解。问题是医生又不干了。一方面离开病人再找空病人费事又费精力,另一方面抢设备也是个困扰。医生需要设备的时候会让护士去看看,如果有就拿过来。可是两个医生一起下这个医嘱就会出问题,一个护士看看还有,回去说有,再去拿的时候另一个护士已经拿着最后一个离开了。就算是同一个医生,下这个医嘱的时候,两个执行的护士也会这么打起来。
    医院方面动了动脑筋,干脆这样吧。一个病房里只能一个医生负责,多个病房公用的设备看到有就可以预定起来。这样病房里的设备是不会抢起来的,而病房外的设备先到先得,也算公平。医生在病人去抽血等等活动的时候再离开病人,而不是每隔固定的时间。每隔一个很长的时间护士会去巡房,如果医生还在被同一个病人纠缠,护士就会让这个病人强制休息。
    不知道有多少人看懂了?下面是答案。
    第一种模式叫做服务队列模式。医生是资源池,病人是待处理请求。这个模式的问题是请求过程中往往会有大量IO出现,此时CPU陷入等待,很不合算。
    第二种模式叫做多线程。医生是CPU,病房是进程。一个病人新建一个进程,系统将CPU在多个进程间调度。此时的问题是进程对系统资源的消耗比较大。
    第三种模式叫做多线程,医生是CPU,病房是进程,床是线程。每个请求新建一个线程,CPU在多个线程间调度。此时系统资源消耗的问题得到一定缓解,问题变成上下文切换和资源锁定造成的浪费。
    第四种模式叫做协程。CPU只在必要的时候离开当前请求。什么是必要的时候呢?就是大规模IO之前。IO完成后,CPU会再度调度回来,这样避免了频繁的上下文切换。而在一个CPU的情况下,这样的模式不会造成竞争。(多线程模式就算只有一个CPU一样竞争,因为CPU可能在任何时间离开线程,包括原子操作内部)
    沈游侠曾说过,好的构架是让瓶颈只出现的CPU上。当然,从更广义的来说是只让瓶颈出现在最紧张的资源上。显然,如果是服务器,CPU和总线带宽多数是最紧张的资源。

2010年6月10日星期四

关于富士康,还有话说

1.无原则的高额抚恤会不会引诱员工跳楼?我觉得这个是无异议的。家里有困难的人为了家人往往什么都愿意做,大家可以想想看如果将抚恤金提高到1亿,家里有困难的职工们跳不跳?
因此不能无原则的抚恤。道义上看是好事的事情如果不谨慎,往往会酿成灾难。
2.劳动规定的问题。有个朋友说这要放英法美,怎么样怎么样的,实话说我觉得没什么可比性。要可比首先就要这三国和中国开放人口互通工作流动互通。一个劳 动力相对不足的国家,工人利益就容易得到保证。而一个劳动力相对过剩的国家(实际上几乎是世界第一过剩),就没什么工人利益可言。
3.还是自杀率比较问题。上篇文章的核心观点其实是,如果富士康比周围工厂更加差劲,而且没什么力量阻止人员流动,那么员工就会跳槽,而不会自杀。而如果富士康周围的工厂也一样差劲,那么大家的自杀率应该差不多。
4.盼头。小猫对上篇文章说了一个悖论,差劲的工厂反而比好的工厂有更低的死亡率。因为差的工厂的工人会希望进入好的工厂,而好的工厂的工人已经无路可 去。我在想,我要是去了google就会自杀?(当然,google已经不在中国了)结论当然是否定的。这个区别的潜台词是,制造行业的工人们,你们最好 的出路也不能带给你们希望。
5.托管。郭台铭想把周边设施卖给政府,再租回来。想法不错,职工的生活本来就不应该企业完全包办,组织组织活动就差不多了。全包办下来的大包大揽模式我们干了几十年,最后还是自己给自己推翻了。
6.罢工。中国的工会是个摆设,这基本已经成为常识了。在这种情况下,工人还能组织起罢工,我在想到底是不是因为日子过不下去了。就是说,尽管从人力供给-生产需求的曲线均衡来说,当前失业率下应该有更低的工资,然而这个工资无法养活一个人。
7.涨价。中国劳动力大大过剩,似乎是个定论,然而是否真的过剩还得看本田将来的反应。风口浪尖上自然不会顶风作案,然而如果确实有降价空间,在风波过去后本田应该会有动作。如果本田继续风平浪静的生产,说明中国的劳动力并不过剩。
8.额外一点,20年后,我们会怎样。现在的社会是普通家庭+独生子女结构的混合,最年长的独生子女也不过30多岁。一个普通家庭大约是一个家庭供养两个 老人和两个子女,供养比例2:6。20年后,社会上的主要劳动力都是现在的独生子女,典型的一个家庭要供养四个老人和一个子女,供养比例大约是2:7。供 养比例并没有升高太多,而每个人可以多获得额外的资源。如果从理想情况来说,每个人的日子应该也还不错。当然,这只是从理想情况来说。
9.额外一点,医学的进步造成贫穷的社会。想想看无劳动力的老人平均寿命从80提高到120的情况。现在退休年龄已经在逐渐延长了,正是在对应这个问题。可是能延长到80么?80岁的老人还准备让他做什么呢?
10.额外一点,中国的医患关系。无中立的第三方监管,无公信力,造成医患相互不信任才是最可怕的问题。
贝壳前几天去看眼睛,觉得眼镜度数不对,准备重配。医生检查之后,做了一个荧光染色检验,检查是否有干眼症。其他检验(眼压,验光)都是先付款后进行,而 且有明显的必要性。这个检验是先做后付款的,因为做的时候还不能让贝壳知道,而且从非专业人员的角度来说看不出必要性。如果从中立角度来说,难免有借机骗 钱的嫌疑。这个检验真的必要么?是不是在借机多收费呢?不过在验光时医师的话打消了贝壳的疑虑,他说,你的眼镜度数配的很准,不用考虑再配了。说这句话的 时候,隔壁就是这家医院开的眼镜店,我相信他是可以从眼镜出售中获得抽成的。这说明两方面问题,一方面医院开和医疗相关的盈利行业,很容易引起"是否必 要"的猜测,从而造成医患关系紧张。而另一方面这个医师在我主动想配眼镜的情况下劝我没有必要,想必不会为了区区几块钱故意多做个检查。