The day before yesterday, I came across a vivid explanation of the concepts of artificial intelligence and digital economy from CAS Academician XU Zon ...
Read more »

六月中旬以来,正值世界杯如火如荼之际。近来情绪不佳,正好借世界杯聊以排遣。从前没有太多耐性看完整场的比赛,而现在却以打发时间的心态看完了一场又一场。令人欣喜的是,看球给了我新的体悟。场上球赛,场下生活,何其相似。 现在的西班牙,看着让人心疼。光有控球,没有进球,一样没用。和日常瞎忙的我,一样一样的。 ...
Read more »

突然发现,写论文就像是“自问自答”。“问”的要有意义,“答”的要有逻辑。“问”需要信息搜索和总结归纳能力,“答”需要数理技术和逻辑论证能力。 写论文这个“自问自答”,没有唯一的标答,需要的是自圆其说的故事。
Read more »

巴黎,几乎已成为浪漫的代名词。这是我想象中的巴黎,也是我认为巴黎该有的样子。

在从机场到旅店的地铁上,我看到对面的大叔在认真的玩扑克牌手机游戏,新上来的西装小帅哥在津津有味的看漫画书,这都不是我想象中巴黎该有的画风……

未完待续……

Read more »

原文:

雷神小动,刺云雨零耶,君将留?

雷神小动,虽不零,吾将留妹留者。

日文:

鸣神の 少しとよみて さし昙り 雨も降らんか 君を留めん

鸣神の 少しとよみて 降らずとも 我は止まらん 妹し留めば

译文:

隐约雷鸣 阴霾天空 但盼风雨来 能留你在此

隐约雷鸣 阴霾天空 即使天无雨 我亦留此地

— 雷神短歌 《万叶集》

Read more »

缘起

昨晚,小平问我如何对大文件进行分割。虽然目前她没有对大文件进行排序的需求,但我想以后很可能会用到。

我想了一个解决方法,是先将大文件分割为若干子文件,然后将各子文件分别加载在内存中进行排序,最后将各排好序的子文件合并为大文件。但是这种方法要求各子文件之间的大小已经确定。以升序为例,即对于子文件 f1, f2, ..., fn,要求 any(f1) <= any(f2) <= ... <= any(fn),这样最好的简单合并才能确保所有记录的有序。

因此,我提出,在划分子文件前,要先遍历大文件一次,统计各数值出现的次数,然后按分布来确定几个分割的阈值,再遍历大文件各条记录,按阈值划分子文件。

以上我的解决方案是可行的,但是我想应该不是最优的,对于子文件的划分有些麻烦。我想看看别人是怎么解决大文件排序问题的,因此这个问题应该很典型了。然后我发现了外部排序,这是和内部排序相对的存在,我以前竟然不知道,看来还是对数据结构及算法学的不够系统。

Read more »