MySQL 字符集相关

查看字符集

查看服务器字符集

1
SHOW VARIABLES LIKE '%char%';

查看数据库字符集

1
SHOW CREATE DATABASE db_name;

查看表的字符集

1
2
SHOW CREATE TABLE table_name;
SHOW TABLE STATUS FROM db_name LIKE '%TABLE_NAME%';

查看字段(列)字符集

1
SHOW FULL COLUMNS FROM table_name;

修改字符集

修改数据库默认字符集

1
2
ALTER DATABASE db_name DEFAULT CHARACTER SET character_name [COLLATE ...];
ALTER DATABASE my_db DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;

修改表默认字符集

1
2
ALTER TABLE table_name DEFAULT CHARACTER SET character_name [COLLATE...];
ALTER TABLE my_table DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;

修改表默认字符集,同时转换有关字段字符集

1
2
ALTER TABLE table_name CONVERT TO CHARACTER SET character_name [COLLATE ...]
ALTER TABLE my_table CONVERT TO CHARACTER SET utf8 COLLATE utf8_general_ci;

修改字段(列)字符集:

1
2
ALTER TABLE table_name CHANGE col_name new_col_name CHARACTER SET character_name [COLLATE ...];
ALTER TABLE my_table CHANGE my_column my_column VARCHAR(100) CHARACTER SET utf8 COLLATE utf8_general_ci;

git 命令通过 HTTP 操作用 Gitlab 搭建的代码库出错

由于项目的需要近日升级了 MySQL 5.5,顺便也把 Gitlab 升级到了 6.7。结果今天在应用服务器上 git pull 的时候出现错误:

1
2
fatal: protocol error: bad line length character: 718
fatal: The remote end hung up unexpectedly

于是尝试了一下 git clone,也还是有错误:

1
fatal: protocol error: bad line length 8188

因为在我自己的电脑上 git 操作一切正常,而两个环境主要的区别就是连接 git 服务的协议,我的机器上用基于 sshgit 协议,而应用服务器上通过 http 协议访问服务。所以问题肯定是和 http 协议有关,于是开始查看 gitlab 的日志,但是看不出有什么问题,查看 Nginx 的日志也没有任何错误。

最后,经过一番搜索,找到了这个Issue
看来是和这个代码有关系。在这个代码里面,对原来直接返回的 block 内容用 encode_chunk 方法重新进行了封装,在原来的 block 前添加了一行块大小信息

由于我现在的 Nginx 是 1.0 的版本,这个版本默认是没有包含 chunking module 的,所以无法正确处理 chunked response,看来只要按大家说的升级 Nginx 就可以了。

我之前是直接通过 yum install 安装的 Nginx,而默认的 yum 封包库里只有 Nginx 1.0,所以我添加了 Webtatic 的封包库,然后卸载 Nginx 1.0,安装 Nginx 1.4。

1
2
3
4
5
rpm -Uvh http://mirror.webtatic.com/yum/el6/latest.rpm
service nginx stop
yum remove nginx
yum install nginx14
service nginx start

整个升级过程非常快,我事先还备份了 /etc/nginx,但是升级后发现配置文件都还在,而且启动 Nginx 1.4 十分顺利。再尝试 git pull,果然OK了!

HTTP_ACCEPT 是 'application/json, */*' 时 Rails 按 'text/html' 处理

用 Rails3 做移动端 App 的 Backend 时,出现一种情况,当移动端使用中国移动的网络时(中国联通无此状况),发送到服务端的 HTTP 请求的 Header 中的 Accept 莫名其妙的的被加上了 */*。而本来客户端只给 Accept 赋值了 application/json,现在就变成了 application/json, */*。Rails 在接收到这种请求时,request 的 format 就会识别为 text/html,导致 controller 最终返回给客户端的是 html 格式的应答。

为什么会被添加 */* 就不做深究了,网络运营商对数据的传输做了哪些处理策略不得而知,就算知道了也无能为力。于是考虑从服务端着手想办法解决。

之前为了发现为什么 Rails 返回的是 html 格式的应答时添加了一些 debug 日志,来观察客户端有没有正确的设置 HTTP Header。

app/controllers/application_controller.rb

1
2
3
4
5
6
7
8
9
10
11
12
13
class ApplicationController < ActionController::Base
protect_from_forgery
before_filter :log_request
def log_request
logger.debug "HTTP_ACCEPT = #{request.headers['HTTP_ACCEPT']}"
logger.debug "CONTENT_TYPE = #{request.headers['CONTENT_TYPE']}"
logger.debug "request.content_type = #{request.headers['action_dispatch.request.content_type']}"
logger.debug "request.accepts = #{request.headers['action_dispatch.request.accepts']}"
logger.debug "request.formats = #{request.headers['action_dispatch.request.formats']}"
end
end

正是根据这些日志发现了被添加的 */*,而且发现只有这一种情况会导致返回 html 应答,所以就针对这种情况做一下处理。
application_controller.rb 中添加如下代码:

1
2
3
4
5
6
7
8
9
before_filter :modify_request_header
def modify_request_header
if request.headers['HTTP_ACCEPT'].include? "*/*"
preferred_accept = request.headers['HTTP_ACCEPT'].split(",").first
logger.debug "Preferred ACCEPT: #{preferred_accept}"
request.format = :json if preferred_accept == "application/json"
end
end

采用这种方式修改了 request.formats 的值,于是终于可以正确返回 json 格式的应答了。

可是为什么 Rails 不按照 Accept 的值的顺序优先采用 application/json 指定的格式呢?

阅读全文

Rails 环境变量设置

什么是环境变量(Environment Variables)

所有的操作系统都提供了各自的机制可以设置环境变量,所有的 Unix类Unix 系统中的每个进程都有各自的环境变量设置,很多 PaaS 的开发者平台(比如Heroku)也提供了配置环境变量的机制。我的理解是,环境变量就是可以在不同环境中单独配置(对环境有依赖),可以让进程在运行时加载并使用,一些底层的基础变量。常见的环境变量比如:PATH、HOME 等等。

为什么在 Rails 中使用环境变量

主要有两方面原因,

  • 应用程序通常都是设计成可以在多种不同环境下部署和运行的,所以代码中不应该出现针对特定环境的内容(比如文件绝对路径),而是应该在运行时根据当前环境使用合适的内容。那么对与这些对环境有所依赖的部分,就可能需要使用环境变量来进行配置。
  • 当应用程序中需要使用一些涉及到安全和隐私的内容时(比如邮箱密码),把这类内容直接写在代码里是很不明智的,因为可能会有很多人可以浏览这部分代码,或者这些代码根本就是开源的。为了保护此类数据,就有必要把它们配置在只有你自己可以访问的环境中,让程序在运行时根据变量名去获取。

怎样在 Rails 中获取环境变量

Ruby 提供了一个很方便的访问环境变量的方式:

1
ENV["VARIABLE_NAME"]

比如要在一个 Rails 应用中配置一个 Gmail 账号来发邮件:

1
2
3
4
5
6
7
8
9
config.action_mailer.smtp_settings = {
address: "smtp.gmail.com",
port: 587,
domain: "example.com",
authentication: "plain",
enable_starttls_auto: true,
user_name: ENV["GMAIL_USERNAME"]
password: ENV["GMAIL_PASSWORD"]
}

这个配置对 Rails 开发者肯定不陌生,这里就是使用环境变量对 Gmail 的用户名和密码进行了保护。

如何配置环境变量

配置环境变量对大多数人来说也并不陌生,比如 Windows 系统属性设置里面就可以找到配置环境变量的按钮,在 Linux/Unix/Mac 之类的操作系统中可以通过配置 .bashrc 或者 .zshrc (根据使用shell来定)之类文件来设置。

比如在 ~/.bashrc 中加入下面内容:

1
2
export GMAIL_USERNAME="foobar@gmail.com"
export GMAIL_PASSWORD="password"

阅读全文

Joining lines without spaces in VIM

在VIM中合并多行文本且其中不产生空格

假设有一个文本文件,里面有很多行文本,我现在想要把所有文本合并为一行。
这不是很简单嘛!
只要 gg 先移动到首行,再 VG(用vG也可)选中所有行,然后用 J 合并所有行不就OK了么?

按上面的操作的确是合并成了一行,可是在原来每两行的连接处都会被添加一个空格,这不是我想要的。
要把所有文本合并为一行且中间不添加空格,该怎么做?
其实也很简单,在 J 之前再多敲一个 g 就可以了,连续的操作就是 ggVGgJ

那要是不合并全部文本,只合并一段(paragraph)文本,该怎么做?
可以这样操作 vipgJ,也就是在visual模式下选中段落然后 gJ

以此类推,基本的方法就是在visual模式下选中要合并的部分 gJ 一下就好。

MySQL vs PostgreSQL

查阅了很多资料,没有一个能明确告诉你用哪个更好,抛开两者一部分技术上的不同优势,整理了几点区别如下,

  1. MySQL诞生于1994年,支持多种存储引擎,常见的有 MyISAM 和 InnoDB,前者实现了高速读但不支持ACID,后者实现了ACID。MySQL在所有权归于Oracle之后,提供了多个版本,其中有免费的也有收费的。

  2. PostgreSQL诞生于1985年,以稳定著称,可靠性、数据一致性与完整性是PostgreSQL的最高优先级特性,完全支持ACID,它只提供单个完整功能的版本。

  3. MySQL在国内更为流行,一个很大的原因在于PostgreSQL在早期不提供Windows版本。

  4. MySQL能够进行快速的读取和大量的查询操作,不过在复杂特性与数据完整性检查方面不太尽如人意。MyISAM引擎是最快的,因为它只执行很少的数据完整性检查,适合于后端读操作较多的站点,不过对于包含敏感数据的读/写数据库来说就是个灾难了,因为MyISAM表最终可能会损坏。

  5. PostgreSQL的可靠性好,在保护数据方面很擅长,而且是个社区项目,不会陷入厂商的牢笼之中。MySQL更加灵活,提供了更多选项来针对不同的任务进行裁剪。

  6. 一个常见的误解就是MySQL要比PostgreSQL更容易学习。关系数据库系统都是非常复杂的,这两个数据库的学习曲线其实是差不多的。

  7. PostgreSQL与Oracle数据库很相似,同为多进程框架,所以能支持高并发的应用场景,所以熟悉Oracle的话转到PostgreSQL数据库上是比较容易的。

  8. MySQL从5.5版本开始性能提升很大,单机性能强于PostgreSQL。

想多了解一点可以看看 http://www.wikivs.com/wiki/MySQL_vs_PostgreSQL

Spring 内置的 multipart 文件上传支持

Spring build-in multipart fileupload support

Spring 内置了对 web 应用 multipart(文件上传) 的支持,即通过可拔插的 MultipartResolver 对象实现对 multipart 的处理。该对象定义在 org.springframework.web.multipart 包内,它是按照 RFC 1867 设计的一个策略接口,自 Spring 2.5 开始,Sping 内包含了一个它的具体实现类,即 org.springframework.web.multipart.commons.CommonsMultipartResolver,该实现类是建立在 Jakarta Commons FileUpload 基础上的,因此在使用时需要引入对 ‘commons-fileupload.jar’ 的依赖。

默认情况下,Spring 是不对 multipart 进行处理的,你可以在你的 web 应用上下文配置中添加一个 MultipartResolver 的实现来启用对 multipart 的支持,这样容器就会对每个请求进行检查,如果发现请求包含了 multipart 数据,就会使用配置的 MultipartResolver 实现来对请求进行处理。

MultipartResolver 的用法

下面例子演示了如何使用 Sping 自带的实现类 CommonsMultipartResolver 来启用 multipart 处理,在 Spring 应用上下文中添加如下配置:

1
2
3
4
5
6
7
<bean id="multipartResolver"
class="org.springframework.web.multipart.commons.CommonsMultipartResolver">
<!-- one of the properties available, the maximum file size in bytes, here is 100KB -->
<property name="maxUploadSize" value="100000"/>
</bean>

添加了该配置,当 Spring 的 DispatcherServlet 收到包含 multipart 的请求后,配置的 MultipartResolver 就会被调用来处理这类请求,它会将当前的 HttpServletRequest 包装成一个 MultipartHttpServletRequest 来支持 multipart 的处理。从 MultipartHttpServletRequest 中你可以获取到 multipart 的数据内容,从而让你的 Controller 能够直接访问请求中包含的文件。

处理表单上传文件请求示例

假设我们创建的表单页面如下:

1
2
3
4
5
6
7
8
9
10
<html>
<head><title>File Upload</title></head>
<body>
<form method="post" action="upload.do" enctype="multipart/form-data">
<input type="text" name="fileName" />
<input type="file" name="fileData" />
<input type="submit" />
</form>
</body>
</html>

我们给 form 标签添加了 enctype 属性,其值为 multipart/form-data,该属性是用来告知浏览器用什么方法对 multipart 字段内容进行编码。

阅读全文