1. 保存网页到本地的方法(2)

    前一篇文章中讲了我常用的保存网页到本地的办法,最近又有一些新的发现。

    首先是 pandoc 转 docx 到 markdown 对 pandoc 的版本是有要求的,目前版本是1.17.1,可以正确处理带中文的文件。但如果用的是更旧的版本(似乎是1.15以前),会提示无法解码 UTF-8,因此推荐先把 pandoc 版本更新。

    本文最主要想更新的是一个新的发现,我找到了一个叫 Typora 的软件,它本身是一个支持所见即所得的 markdown 编辑器(从知乎上的讨论来说,实现这样的东西似乎难度还很大),但它居然还支持了粘贴网页直接转换成 markdown 的功能。也就是说,不再需要手动保存成 docx,只需要把网页直接粘到里面就已经是 markdown 了。

    还有一点很重要的特性,就是由于它本身所见即所得的特性,相当于每次打开 md 文件都会自动渲染成网页格式,所以甚至省掉了再重新转换成 html …

    read more
  2. 保存网页到本地的两种办法

    Edit: 后续更新

    自从不太使用 Evernote 之后,如何干净地保存网页信息就成了一个大问题。所谓「干净」,就是只保存网页主体的信息,而不包括其它不相关的部分,也就相当于保存下 Firefox 所提供的阅读模式中显示的内容。

    本来,Evernote 提供的「悦读」是一个很好的方案,它首先提供了一个阅读模式,可以很好地对绝大多数网页实现抓取,然后它可以直接保存到 Evernote,可以说基本解决了我的需求。但由于各种原因,我现在基本不用 Evernote,使得这个需求还不太好自己解决了。

    最开始想的办法是自己写一个 Python 脚本,爬一下网页,然后抓取主体信息,最后保存,看起来似乎每一个环节都不复杂,但尝试写了一下发现还是很麻烦:不同网站网页结构不同,涉及到如何分别处理的问题;有些文章需要翻页;有些网站如知乎专栏为了防转载做了不少障碍,等等。最终发现这个脚本要达到预期的目的,远不是半个下午就能轻松解决的小项目,暂时就打消了这个念头。

    经过一些有意搜索和偶然的发现,现在有两种对我而言比较合适的方法。

    方法一是打印到 PDF。这个需要用到微软的 Edge 浏览器 …

    read more
  3. Git 笔记

    声明:这个笔记是根据我自己的理解所写,可能有部分理解有误或不全,仅供参考。

    以前在装 Vundle 的时候安装了 Git,但只作为 Vundle 的后台使用,没有直接使用过 git。趁着这次搬博客的机会,大致学会了基础的使用,本文是对 git 基本操作尤其是与 github 结合的一个简单笔记,适合零基础的人入门,也作为我自己的一个参考手册。


    最简版

    • git init,新建一个 repo
    • git clone <some_url> [destination_dir],从 Github 或其它网站下载 repo 的完整内容
    • 修改文件,然后 git status 查看有哪些修改
    • git add . 添加所有的修改到 stage
    • git status,确认所有修改
    • git commit …
    read more
  4. 用 pelican 创建静态网站放到 GitHub 上

    去年在 GoDaddy 买域名半送的 Linux 空间到期了,最近一直在找替代方案。大致的方向是想用 GitHub 免费的 github pages 作为 host,因为此前已经知道 jekyll 是一个选项。但是考虑到 jekyll 是基于 Ruby 的,而我又不想在电脑里再多装一个我不太可能会用到的编程语言,因此搜索了一下基于 Python 的方案,果然,很轻松就地找到了 pelican

    以下是我用 pelican 创建静态网站并托管到 github pages 的流程,希望能让其他看到的人省点时间。另一点专门写出来的原因是,目前我在网上找到的关于 pelican 的教程绝大部分都是针对 Linux 系统的,像 make 之类的命令在 Windows 下根本就不适用,因此我也花了不少准备的时间才把这个系统搭起来。

    1. 准备工作

    Python 环境 …

    read more
  5. High-level GPU-accelerated Program in Python

    After some basic digging, sadly I found that currently (2015.12) there’s (probably) no mature solution that offers simple high-level GPU programming in Python. The commercial NumbaPro is promising, especially considering the success of its free version numba. However from my test, the JITted program is still highly unstable …

    read more

« Page 3 / 9 »

links

social