MIT麻省理工学院python教程

Python Programming:
An Introduction to Computer Science

Contents
1 Computers and Programs 1
1.1 The Universal Machine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Program Power . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 What is Computer Science? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.4 Hardware Basics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.5 Programming Languages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.6 The Magic of Python . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.7 Inside a Python Program . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.8 Chaos and Computers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.9 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

Download:

File name: PythonProgrammingBook.pdf
File size:1.20 MB

《Python标准库》

1. 核心模块

* _ _builtin_ _ 模块

* exceptions 模块

* os 模块

* os.path 模块

* stat 模块

* string 模块

* re 模块

* math 模块

* cmath 模块

(..更多内容)

学习python处理python编码

概括从python开始就处理unicode字符,python源文件的编码与解码,我们写的python程序从产生到执行的过程如下 (..更多内容)

搜索引擎收录网站的原理

在网络推广中搜索引擎营销被人们看成是重要的推广方式,而事实搜索引擎也是人们获取信息的重要来源,我们在针对搜索引擎网站的收录和评价规律,我们对网站的结构进行合理的调整、对网页的内容也页面的要素包括title、mate、keywords等做出规范的处理,针对企业网站优化新竞争力的《企业网站优化策略研究报告》对所有中小企业制定和实施网站优化策略具有普遍的指导意义,是一部名副其实的,最专业、最系统的中小企业网站优化指南,从而使得每个网页上面的信息能够最有效的反应网页所需要表达的信息。
那搜索引擎是如何来收录我们的网站呢,依google为例,google使用两个探测器来抓取网站上面的内容一个是Freshbot和Deepbot。Deepbot每月会出击一次,受访内容在google的主要索引之中,Freshbot会不断的刷新新的网页,并发现新的网页,当发现新的网页时,google之后会频繁的来访,看是否有更新的内容。
根据google的操作模式主要包涵一下几个方面:
(1)抓取状态,不管是百度还是google他们的探测器都是不断的发现新的内容,并进行实时更新。
(2)网页仓库,探测器将收集来的网页集中在一个地方进行储存,然后等待索引的处理。
(3)索引处理,索引会将收集来的网页进行分类的整理、压缩,分类和压缩完成以后然后进行索引的编类,而未被压缩的原始网页资料将会被删除。
(4)索引状态,所以会将压缩好的网页分别放在不同的索引下面。
(5)问询状态,计算机会将用户问询的白话转化成搜索引擎能识别的计算机语言,然后从索引中找到相应的答案。
(6)排名状态,搜索引擎会将相关的答案根据一定的标准进行排列给用户,同时搜索引擎也会将认为最好的答案被推荐到首位,较次的排列其后,以此类推。

原文地址:http://www.jingzhengli.cn/Blog/lxq/1198.html 

五个免费开源的数据挖掘软件

在网上看到一篇文章介绍五个免费开源的数据挖掘软件,转过来。

Orange

Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。其由C++ 和 Python开发,它的图形库是由跨平台的Qt框架开发。

RapidMiner

RapidMiner, 以前叫 YALE (Yet Another Learning Environment), 其是一个给机器学习和数据挖掘和分析的试验环境,同时用于研究了真实世界数据挖掘。它提供的实验由大量的算子组成,而这些算子由详细的XML 文件记录,并被RapidMiner图形化的用户接口表现出来。RapidMiner为主要的机器学习过程提供了超过500算子,并且,其结合了学习方案和Weka学习环境的属性评估器。它是一个独立的工具可以用来做数据分析,同样也是一个数据挖掘引擎可以用来集成到你的产品中。

Weka

由Java开发的 Weka (Waikato Environment for Knowledge Analysis) 是一个知名机器学机软件,其支持几种经典的数据挖掘任务,显著的数据预处理,集群,分类,回归,虚拟化,以及功能选择。其技术基于假设数据是以一种单个文件或关联的,在那里,每个数据点都被许多属性标注。 Weka 使用Java的数据库链接能力可以访问SQL数据库,并可以处理一个数据库的查询结果。它主要的用户接品是Explorer,也同样支持相同功能的命令行,或是一种基于组件的知识流接口。

JHepWork

为科学家,工程师和学生所设计的 jHepWork 是一个免费的开源数据分析框架,其主要是用开源库来创建 一个数据分析环境,并提供了丰富的用户接口,以此来和那些收费的的软件竞争。它主要是为了科学计算用的二维和三维的制图,并包含了用Java实现的数学科学库,随机数,和其它的数据挖掘算法。 jHepWork 是基于一个高级的编程语言 Jython,当然,Java代码同样可以用来调用 jHepWork 的数学和图形库。

KNIME

KNIME (Konstanz Information Miner) 是一个用户友好,智能的,并有丰演的开源的数据集成,数据处理,数据分析和数据勘探平台。它给了用户有能力以可视化的方式创建数据流或数据通道,可选择性地运行一些或全部的分析步骤,并以后面研究结果,模型 以及 可交互的视图。 KNIME 由Java写成,其基于 Eclipse 并通过插件的方式来提供更多的功能。通过以插件的文件,用户可以为文件,图片,和时间序列加入处理模块,并可以集成到其它各种各样的开源项目中,比如:R语言,Weka, Chemistry Development Kit, 和 LibSVM.

源文:http://www.junauza.com/2010/11/free-data-mining-software.html(墙)

有意思吧:据说是最准的图片心理测试

如今,“心理测试”也算是网上的一门“显学”了。但到底准不准,是否可信,就见仁见智了。下面的内容是关于“九型人格”的,以前发布过;但我对比了一下,两篇文章有些出入。比如对于第7张图片的分析,这篇文章解读为“具分析力,可靠,自信”,另一篇则分析为“无忧无虑、好玩型”;从我自己选择的第4张图片的解读来看,分析还是挺靠谱的。在我看来,网上很多非专业的心理测试,还是以一种娱乐的心态对待比较合适。看看下面的测试,跟你的情况是否相符?

(..更多内容)

micolog升级错误说明

Micolog发布了新版本于是第一时间去升级了一下,却发现升级完毕后,出现了以下问题:

    No.1

    Sorry, the server encountered an error. We have logged this error and will look into it.

    有人说这是升级后,服务器建立索引的延时问题,等了半个小时左右,发现提示依旧。没办法,只好自己琢磨了一下。登陆Micolog的admin页面,发现可以正常登陆,仔细查看了一下Micolog的后台设置,终于找出了原因。

    升级前,我的Micolog启用了缓存,而升级后的Micolog默认是不启用缓存的,于是解决办法找到了,重新启用缓存,清空缓存,再看看您网站的首页,升级成功,O(∩_∩)O~

IPV6+GAE WallProxy的简单使用


关于GAE飞跃长城的文章网上一搜一大把
为什么还要写这个呢?
原因一是太复杂..过程太多 新手看了不敢去尝试
二是缺少部分步骤及细节 新手无法成功使用
我现在把步骤及乱七八糟的东西整合简化 加入部分细节 菜鸟也能轻松上手哦~~
本来想写个可视化软件的  后来想想觉得没必要 这样已经很简单了~呵呵

第一步:开启IPV6 (已经开启的无需重复)

很简单 输几个命令就行了  访问这里获取 开启方法 http://x1991.com/text/runipv6.txt

第二步:创建GAE应用
http://appengine.google.com/    
用你的google账号登录  第一次需要输入国家手机号验证一下  输入真实的就行了
google会给你发一个验证码  通过了就可以创建应用了  
点击 Create an Application 创建一个新的应用
Application Identifier:
就是你以后用到的二级域名 自己想个好点的名字
其他随便填啦~完成后点击创建就OK了

第三步:给创建的应用上传代理所需的文件
将附件解压到D盘根目录 方便之后操作  路径为:d:\wallproxy

打开gae_server里的app.yaml 把“your-gae-id”改成你刚才创建应用时想的二级域名

打开CMD 不用我教了吧?
输入 d:
再输入 cd d:\wallproxy


然后执行上传命令  SDUpload update up
注意 之前如果用IPV6改过Hosts文件的  把google地址转向IPV6地址的需要改过来 否则会上传失败



出现E-mail字样就填入你的 gmail账号 回车输入password  直接输 别输错  界面是不显示你输入字符的
不要以为没有输进去   输入完回车 开始上传......



第四步:修改hosts文件 已经基本完成了哦

打开C:\Windows\System32\drivers\etc里的 hosts 加上两行并保存:
===========================================
2404:6800:8007::63 你创建的二级域名.appspot.com 
2404:6800:8007::63 www.appspot.com 
==================================

第五步:完成了哦~~~~

打开D:\wallproxy\local里的 WallProxy.exe 点击“设置”  将 url这一行改成你申请的域名


确定后点启动.......将代理服务器设置为  127.0.0.1 端口 8086....好吧
试试打开twitter youtube facebook吧~~

原文地址:http://x1991.com/post-78.html

Google WebP——让图片更小,让Web更快

Google在I/O开发者大会上推出WebM网络视频标准后,Google日前又对外宣布了一种新的图片压缩格式WebP,可以让通过网络传输的图片变得更小。Google声明说,WebP格式可以让图片的大小减少39%,从而加快了页面的装载速度。

WebP(发音为“weppy”/(wĕpˈē)/)是Google开发的一种图片压缩格式,用于降低图片文件的大小。Google说图片和照片差不多占到了通过网络传输的数据总量的65%,这是相当大的份额。这也就可以理解为什么降低每一个图片的大小,可以影响平均的页面大小,进而加快页面的装载速度。

WebP中使用的压缩算法,借鉴了Google此前使用的WebM(一种用于编码和压缩视频的开源媒体文件格式)中的VP8编解码器。在转换了1,000,000多幅随机选取的图片后(多是JPEG格式,部分是PNG和GIF格式),结果显示使用WebP可以让图片的大小平均减少39%。Google还证实说,图片的质量在转换后并没有明显的下降。

WebP对比JPEG 

WebP对比JPEG 

WebP对比JPEG

WebP意在作为一种更好的图片压缩格式替换JPEG。其工作原理是,WebP图片被放在一个轻量级的RIFF容器中,虽然每个图片只是增加了很少字节(少到20字节),但是却拥有了容纳更多字节的功能,这样图片就可以增加更多的元数据。

现在Google正在为Linux x86 64位机提供免费开源的解码器,Windows版本晚些时候推出。Google还在努力提供一个WebKit包,可以让Chrome浏览器显示WebP图片。

目前Google还建立了一个在线图片库,任何人都可以前去浏览转换之后的WebP图片和JPEG原图质量的比较。其中WebP图片现在是被封装在PNG容器中的,这样一般的浏览器就都可以正常访问。

Google计划在将来增加对透明层(Transparency Layer)的支持。另外,WebP现在是Google“我们一起让Web更快” 计划中的一部分,类似的项目还包括页面加速(Page Speed)、速度跟踪器(Speed Tracer)和SPDY。

“翻来覆去”巧记英语单词

在英语中,很多单词可以"翻来覆去”,意思却完全不一同。再配合一定的口诀,能让你达到“回眸一笑百媚生”的效果,不信可以试一试! (..更多内容)