| xu's profile我想我是海PhotosBlogLists | Help |
|
April 26 北京法源寺李敖自己经常吹的一本书,闲暇之余看了一看。确实写得还不错,比较有个性,充满哲学思考。看来李敖赞美自己还是有点资本的。我对里面的诗印象很深刻,特别是谭嗣同的:
其一:
同住莲华语四禅, 空然一笑是横阗。 惟红法雨偶生色。 被黑罡风吹堕天。 大患有身无相定, 小言破道遣愁篇。 年来嚼蜡成滋味, 阑入楞严十种仙。 其二:
死生流转不相值,
天地翻时忽一逢。 且喜无情成解脱, 欲追前事已冥濛。 桐花院落乌头白, 芳草汀洲雁泪红。 再世金环弹指过, 结空为色又俄空。 还有唐才常就义的留言:
剩有头颅酬故友,无损面目见群魔
都是才子啊,诗章境界高远
April 18 svm最近的项目毫无进展,关键还是特征选取问题,尝试了很多新特征,改进都不是很多。
一直觉得奇怪,使用svm_light进行分类的时候,用默认的linear 核函数竟然效果总是好于polynomial和rbf核函数。 本来是按直觉,用曲线建立分界面效果应该更好的,假如排除过拟合的问题的话。。。以前看过另外一篇机器学习的论文,他的效果也跟我的差不多,诡异。可惜这次需要使用实数特征,结果无法用原来的最大熵程序去对比了。
除核函数选取外,还尝试了不同的c对svm效果的影响。线形核函数基础上,将c设为10,结果训练了4个小时,汗,而且效果巨烂。跟线形核函数上c越大训练时间越长不同,rbf核函数上c越大训练时间越短。而且理论上来说,rbf的c越大,对训练数据的分类拟合越准确。所以又尝试了rbf和c=100,
但是。。。效果也巨烂,无语。
由于训练过程中反例是正例的10倍左右,故会存在严重的data imbalance问题,导致切分分数一般都是很大的负数。朱募华和水母AI版的同志们给了我一个建议,就是把所有的正例拿来和所有的负支持向量一起训练,而负支持向量可以在初始训练得到的模型中读出。后来我也尝试了这个方法,虽然效果没有本质上的变化,但是感觉比较有趣
|
|
|