xu's profile我想我是海PhotosBlogLists Tools Help

Blog


    April 26

    北京法源寺

    李敖自己经常吹的一本书,闲暇之余看了一看。确实写得还不错,比较有个性,充满哲学思考。看来李敖赞美自己还是有点资本的。我对里面的诗印象很深刻,特别是谭嗣同的:
    其一:
      同住莲华语四禅,
      空然一笑是横阗。
      惟红法雨偶生色。
      被黑罡风吹堕天。
      大患有身无相定,
      小言破道遣愁篇。
      年来嚼蜡成滋味,
      阑入楞严十种仙。
     
     
    其二:
      死生流转不相值,
      天地翻时忽一逢。
      且喜无情成解脱,
      欲追前事已冥濛。
      桐花院落乌头白,
      芳草汀洲雁泪红。
      再世金环弹指过,
      结空为色又俄空。
     
    还有唐才常就义的留言:
     
    剩有头颅酬故友,无损面目见群魔
     
    都是才子啊,诗章境界高远
     
     
     
    April 18

    svm

    最近的项目毫无进展,关键还是特征选取问题,尝试了很多新特征,改进都不是很多。
     
    一直觉得奇怪,使用svm_light进行分类的时候,用默认的linear 核函数竟然效果总是好于polynomial和rbf核函数。 本来是按直觉,用曲线建立分界面效果应该更好的,假如排除过拟合的问题的话。。。以前看过另外一篇机器学习的论文,他的效果也跟我的差不多,诡异。可惜这次需要使用实数特征,结果无法用原来的最大熵程序去对比了。
     
    除核函数选取外,还尝试了不同的c对svm效果的影响。线形核函数基础上,将c设为10,结果训练了4个小时,汗,而且效果巨烂。跟线形核函数上c越大训练时间越长不同,rbf核函数上c越大训练时间越短。而且理论上来说,rbf的c越大,对训练数据的分类拟合越准确。所以又尝试了rbf和c=100,
    但是。。。效果也巨烂,无语。
     
    由于训练过程中反例是正例的10倍左右,故会存在严重的data imbalance问题,导致切分分数一般都是很大的负数。朱募华和水母AI版的同志们给了我一个建议,就是把所有的正例拿来和所有的负支持向量一起训练,而负支持向量可以在初始训练得到的模型中读出。后来我也尝试了这个方法,虽然效果没有本质上的变化,但是感觉比较有趣
     
     
     
     
    April 13

    最近烦心事很多

    欲说还休,欲说还休~~
    对自己说,一定要坚强。