七种 WebSocket 框架的性能比较

1、 原文地址 colobu.com

前一篇文章使用四种框架分别实现百万 websocket 常连接的服务器介绍了四种 websocket 框架的测试方法和基本数据。

前一篇文章使用四种框架分别实现百万 websocket 常连接的服务器介绍了四种 websocket 框架的测试方法和基本数据。 最近我又使用几个框架实现了 websocket push 服务器的原型,并专门对这七种实现做了测试。 本文记录了测试结果和一些对结果的分析。 这七种框架是:

NettyUndertowJettyVert.xGrizzlyspray-websocketnodejs-websocket/Node.js

最近用 Golang 实现了第八种,Go 表现还不错。

Go

一、测试环境

使用三台 C3.4xlarge AWS 服务器做测试。 一台作为服务器,两台作为客户端机器, 每台客户端机器启动 10 个 client, 一共 20 个 client C3.4xlarge 的配置如下:

型号vCPU内存 (GiB)SSD 存储 (GB)c3.large23.752 x 16c3.xlarge47.52 x 40c3.2xlarge8152 x 80c3.4xlarge16302 x 160c3.8xlarge32602 x 320

服务器和客户端机器按照上一篇文章做了基本的优化。

以下是测试的配置数据:

20 clientssetup rate 设为 500 * 20 requests/second = 10000 request /second每个 client 负责建立 50000 个 websocket 连接等 1,000,000 个 websocket 建好好,发送一个消息 (时间戳) 给所有的客户端,客户端根据时间戳计算 latency如果服务器 setup rate 建立很慢,主动停止测试监控三个阶段的性能指标: setup 时, setup 完成后应用发呆 (idle) 时,发送消息时

二、测试结果

2.1、Netty

Setup 时

cpu idle: 90%minor gc: Fewfull gc: No

Setup 完成, 应用 Idle 时

cpu idle: 100%memory usage: 1.68Gserver free memory: 16.3G

发送消息时

cpu idle: 75%

minor gc: few

full gc: No

Message latency (one client)

count = 50000

min = 0

max = 18301

mean = 2446.09

stddev = 3082.11

median = 1214.00

75% <= 3625.00

95% <= 8855.00

98% <= 12069.00

99% <= 13274.00

99.9% <= 18301.00

2.2、Vert.x

Setup 时

cpu idle: 95%minor gc: Fewfull gc: No

Setup 完成, 应用 Idle 时

cpu idle: 100%memory usage: 6.37Gserver free memory: 16.3G

发送消息时

cpu idle: 47% ~ 76%

minor gc: few

full gc: few

Message latency (one client)

count = 50000

min = 49

max = 18949

mean = 10427.00

stddev = 5182.72

median = 10856.00

75% <= 14934.00

95% <= 17949.00

98% <= 18458.00

99% <= 18658.00

99.9% <= 18949.00

2.3、Undertow

Setup 时

cpu idle: 90%minor gc: Fewfull gc: No

Setup 完成, 应用 Idle 时

cpu idle: 100%memory usage: 4.02Gserver free memory: 14.2G

发送消息时

cpu idle: 65%

minor gc: few

full gc: No

Message latency

count = 50000

min = 1

max = 11948

mean = 1366.86

stddev = 2007.77

median = 412.00

75% <= 2021.00

95% <= 5838.00

98% <= 7222.00

99% <= 8051.00

99.9% <= 11948.00

2.4、Jetty

Setup 时

cpu idle: 2%minor gc: Manyfull gc: Nomemory usage: 5Gserver free memory: 17.2G

当建立 360,000 左右的 websocket 时, setup 非常的慢, gc 频繁,无法继续正常建立 websocket, 主动终止测试。

2.5、Grizzly

Setup 时

cpu idle: 20%minor gc: Somefull gc: Somememory usage: 11.5Gserver free memory: 12.3G

当建立 500,000 左右的 websocket 时, setup 非常的慢, gc 频繁,无法继续正常建立 websocket, 主动终止测试。

2.6、Spray

Setup 时

cpu idle: 80%minor gc: Manyfull gc: No

当建立 500,000 左右的 websocket 时, setup 非常的慢, gc 频繁,无法继续正常建立 websocket, 主动终止测试。

2.7、Node.js

Setup 时

cpu idle: 94%

Setup 完成, 应用 Idle 时

cpu idle: 100%memory usage: 5.0Gserver free memory: 16.3G

发送消息时

cpu idle: 94%

Message latency (one client)

Message latency

count = 50000

min = 0

max = 18

mean = 1.27

stddev = 3.08

median = 1.00

75% <= 1.00

95% <= 1.00

98% <= 1.00

99% <= 1.00

99.9% <= 15.00

2.8、Go

Setup 时

cpu idle: 94%

Setup 完成, 应用 Idle 时

cpu idle: 100%memory usage: 15Gserver free memory: 6G

发送消息时

cpu idle: 94%

Message latency (one client)

Message latency

count = 50000

min = 0

max = 35

mean = 1.89

stddev = 1.83

median = 1.00

75% <= 1.00

95% <= 2.00

98% <= 2.00

99% <= 4.00

99.9% <= 34.00

三、测试结果分析

Netty, Go, Node.js, Undertow, Vert.x 都能正常建立百万连接。 Jetty, Grizzly 和 Spray 未能完成百万连接Netty 表现最好。内存占用非常的少, CPU 使用率也不高。 尤其内存占用,远远小于其它框架Jetty, Grizzly 和 Spray 会产生大量的中间对象,导致垃圾回收频繁。Jetty 表现最差Node.js 表现非常好。 尤其是测试中使用单实例单线程,建立速度非常快,消息的 latency 也很好。 内存占用也不错Undertow 表现也不错,内存占用比 Netty 高一些,其它差不多这里还未测到 Spray 另一个不好的地方。 在大量连接的情况小,即使没有消息发送,Spray 也会占用 40% CPU 时间