DataForest Cloud 测评 - 不出意外之后会是我新的长期选择

CAUTION
根据商家反馈，当前注册验证手机号存在问题，手动验证帐户时，发放推荐奖励确实存在问题。等待官方修复。同时也可以发工单进行人工激活注册，说明来自链接 https://cloud.dataforest.net/ref/ht3fgpa2x0ls 的邀请注册即可让客户重新补发奖励的25欧元。

商家介绍#

DataForest（cloud.dataforest.net）是德国本土的云厂商，机房在法兰克福。它家卖的 KVM 实例叫 Seed，底层存储是 NVMe SSD + Ceph 三副本，按小时计费。他们很多人都见过吧，Avoro,PHP-Friends,包括机房服务 DataForest 都是他们的产品。云可以说是他们的第三代产品？

后台是自研的云面板，开机速度，响应速度都挺不错的。支持API进行管理。

工单响应速度upup，相比其他半天甚至几天找不到人的商家，这个处理工单速度不赖。

价格全部含 19% 德国增值税。

本人AFF: 下单地址走此AFF注册可以获得25欧元代金券

Entry — 入门档，按可用性分配 CPU，至少给到 Intel Xeon Gold，DDR4，平衡型 IOPS。

官方话术里把这档定位成开发/测试机，便宜是它最大的卖点。（~~当然也不便宜~~）

机型	vCPU	内存	盘	流量	月费
S	1C	2G	20G	10 TB	3,65 €
M	2C	4G	40G	10 TB	7,29 €
L	4C	8G	80G	10 TB	14,59 €
XL	8C	16G	160G	10 TB	23,91 €

Standard — 通用档，AMD EPYC Turin，2.6 GHz 起、最高 4.5 GHz，DDR5，IOPS 比 Entry 高一档。

目标客户是网站、数据库、CI/CD。提供CPU的性能保证。

机型	vCPU	内存	盘	流量	月费
S	2C	8G	80G	20 TB	9,01 €
M	4C	16G	160G	20 TB	18,02 €
DS	2C	8G	320G	20 TB	25,19 €
L	8C	24G	240G	20 TB	33,19 €
XL	10C	32G	360G	20 TB	43,63 €
XXL	16C	64G	500G	20 TB	67,09 €
DXXL	16C	64G	5120G	20 TB	373,58 €

Performance — CPU 优化档，AMD EPYC Turin (High Frequency)，3.3 GHz 起、最高 5 GHz，DDR5，“最大 IOPS”。

目标是 WordPress、IO、对单核敏感的应用。

机型	vCPU	内存	盘	流量	月费
S	2C	8G	80G	20 TB	12,26 €
M	4C	16G	160G	20 TB	24,51 €
L	8C	32G	240G	20 TB	46,16 €
XL	10C	48G	360G	20 TB	59,85 €
XXL	16C	64G	500G	20 TB	93,03 €
MXXL	16C	192G	500G	20 TB	160,71 €

加购项目前有三样：备份（每天异地，按小时计费）、快照（一份，按小时计费）、IPv4（按小时计费，按需开关）。价格都不友好，这里除了IPv4是固定价格其他都是根据机器来的，机器越贵，备份快照的价格越高。

需要注意的是。

他们流量采用很少见的流量池小时叠加的方案，按时间累计流量额度。和 Hetzner 之类开机就可以刷满20T 流量的有本质的区别。

每台 Seed 按小时向共享池“贡献”流量额度，同时所有机器共同消耗这个池，直到月末达到最大流量。

此举我觉得是继承了 Avoro 站点之前大规模滥用流量的事情，很多人恶意按小时刷光流量，因此后来取消了无限流量改成了20T。

测试机器选型#

受测机器	套餐	vCPU	内存	盘	流量	月费
Entry	XL	8C	16G	160G NVMe-Ceph	10 TB	23,91 €
Standard	M	4C	16G	160G NVMe-Ceph	20 TB	18,02 €
Performance	M	4C	16G	160G NVMe-Ceph	20 TB	24,51 €

测试项目#

CPU 微基准

sysbench cpu — 经典素数计算，单线程衡量主频差距，多线程衡量到 4 vCPU 的扩展性
7-zip benchmark — LZMA 压缩 / 解压，对内存子系统敏感，能反映”频率涨了但内存跟不上”的场景
openssl speed — AES-GCM / SHA-256 / ChaCha20-Poly1305，看硬件加密指令集（AES-NI 等）的差距，HTTPS 终结大流量直接对应
stress-ng matrix — 合成 FP 矩阵运算，主要用来确认重负载下不会因为热限频/超售出现衰减

内存

sysbench memory — 顺序/随机 × 读/写四组，看带宽和延迟的基本面
STREAM Triad — 业界跑了二十年的标准，判定 ClickHouse / 大缓存这种带宽敏感型负载的金标准
mbw MEMCPY — sysbench memory 在 KVM 上有已知噪声，mbw 用来对照修正

磁盘 IO

fio 4K 随机 — 数据库小事务的标准 proxy，Ceph 三副本最容易拉开差距的地方
fio 64K / 1M 顺序 — 大文件读写、流式备份场景
fio fsync 4K — 这一项最关键，决定 PostgreSQL/MySQL WAL 写入瓶颈，Ceph 类盘 IOPS 数字虚高，只有 fsync 不会骗人
ioping — 微秒级单次延迟，索引扫描 / KV 直接受影响

网络

ping 多锚点 — 8.8.8.8 / 1.1.1.1 / Cloudflare / GitHub /
Ookla speedtest 多服务器 ID — 法兰克福本地 + 欧洲 + 美东 + 亚太五个方向。
iperf3 → 公共 LG — 真实长流的 sustained 带宽
curl 大文件 HTTP — 模拟 apt/docker pull 这种实际发生的下载

真实服务负载

PostgreSQL 17 — sysbench oltp 四种 workload + pgbench TPC-B，覆盖混合读写、点查、纯读、TPC-B
Redis 7 — pipeline + 多种命令，单核敏感型工作负载的代表
Nginx + wrk — 静态文件服务，1k 小文件考验 syscall/中断，100k 大文件考验吞吐
Node.js — JSON 接口 + PBKDF2 计算密集型，看 V8 JIT 的表现
Go build / Rust build — 现代后端语言的编译开销
Docker pull / run / build — 容器日常工作流的延迟
OpenSSL 编译 (make -j4) — 经典的 C 工程并行编译，CI 场景代表
git clone / jq 处理大 JSON — 开发机日常工具的真实耗时

稳定性采样

整套测试期间持续跑 vmstat / mpstat，记录 steal% / iowait% / loadavg。

CPU#

先看最直观的 sysbench prime（数到 30000 的素数），数值为 events/s：

线程	Entry	Standard	Performance
1 thread (events/s)	227.74	1206.20	1321.71
4 threads (events/s)	1762.67	4794.27	5289.90

单线程 Performance 是 Entry 的将近 6 倍。Standard 和 Performance 的单线程差距 9.6%，刚好对得上 4.5 → 5.0 GHz 的频率比。但是到 4 线程 Performance 只比 Standard 快 10%——4 个 vCPU 已经撞到内存子系统的瓶颈了。

7-zip 测试：

	ST MIPS	MT MIPS
Entry	4,462	35,988
Standard	7,916	39,743
Performance	8,125	39,478

MT 总分 Standard 居然比 Performance 高一点点。原因和上面一样，4vCPU已经是瓶颈了。

OpenSSL 全核加密走的是硬件指令集，差距更夸张：

16 KB 块	Entry	Standard	Performance
AES-256-GCM	~24 GB/s	~74 GB/s	88.6 GB/s
SHA-256	3.20 GB/s	8.48 GB/s	9.66 GB/s
ChaCha20-Poly1305	16.7 GB/s	21.95 GB/s	24.20 GB/s

Zen 5 的 AES-NI 比 Skylake-SP 快了快 4 倍，HTTPS 、TLS 大流量场景是更适合的场景。

stress-ng 的 matrix 测试（合成 FP 矩阵运算）。 bogo ops/s 是 stress-ng 自定义的”完成多少轮基准操作每秒”：

	并发 hogs	总 bogo ops/s	单核 bogo ops/s
Entry	8	22,206	2,781
Standard	4	37,377	9,362
Performance	4	42,378	10,621

Entry 是 8 核硬怼 4 核，总分还是只有 EPYC 两档的一半多一点；单核换算下来 Entry 只有 Performance 的 26%、Standard 的 30%。Standard 与 Performance 的单核差距 13.5%，与单线程 sysbench prime（9.6%）、7-zip ST（2.6%）方向一致——三个测试越偏纯算就越接近频率比。

内存#

测试	Entry	Standard	Performance
sysbench 顺序读 1M (MiB/s)	154,300	353,962	368,113
sysbench 顺序写 1M (MiB/s)	21,151	5,789	8,001
sysbench 随机读 4K (MiB/s)	15,868	21,701	22,117
sysbench 随机写 4K (MiB/s)	477	289	368
STREAM Triad (MB/s)	60,446	146,633	114,423
mbw MEMCPY (MiB/s)	4,206	19,832	18,762

读带宽 DDR5 双倍碾压 DDR4 这点是必然的。但有两个问题：

第一，STREAM Triad Standard（146 GB/s）居然反超 Performance（114 GB/s）。这不是测试错误，多次复测一致。原因是底层硬件——Standard 跑的是 EPYC 9655（96 核芯片），内存通道宽，分给单个 vCPU 的带宽配额自然多；Performance 跑的是 9575F（64 核高频），频率高但内存通道相对挤。所以如果你跑 ClickHouse 聚合、超大 in-memory 缓存这种带宽敏感的活，Standard 反而更好。

第二，sysbench memory write 那一栏 Entry 看起来比 Standard/Performance 高 3–4 倍，这个数字是bug。sysbench memory 的 write 模式在 KVM 上一直有 store buffer 折算的噪声，已经是众所周知的”垃圾”指标。

磁盘#

4K 随机用 fio，QD=64、4 jobs、direct=1：

	Entry	Standard	Performance
4K randread IOPS	153k	227k	236k
4K randwrite IOPS	144k	213k	247k
4K 70/30 读 IOPS	99.7k	160k	161k
4K 70/30 写 IOPS	42.8k	68.7k	69.0k

Performance 在写入侧是有优势，但读侧 Standard 已经追到只差 4%。

大块顺序更夸张：

	Entry	Standard	Performance
1M 顺序读 (GiB/s)	33.9	86.0	103
1M 顺序写 (MiB/s)	7455	18900	21100

86 ~ 103 GiB/s 这个数字物理上不可能是单盘速度。即便 fio 已经开了 direct=1，宿主上的 RBD 客户端缓存和 host page cache 还是把读绕回去了。这是云厂商 Ceph 类盘的常态，写入数据更能反映真实性能。

然后是数据库里的 fsync 4K 同步写：

	Entry	Standard	Performance
sync randwrite IOPS	689	775	700

三档差距 ±15% 以内。这就是 Ceph 三副本最大的问题：对一个 4K 块要 fsync，就要等三个副本网络确认。所以官方那句”Performance: maximum disk performance”在 fsync 这个最重要的 DB 指标上其实没体现。

ioping 微延迟可以稍微挽回一点 Performance 的颜面：

	Entry	Standard	Performance
顺序 min/avg (μs)	154 / 226	42 / 89	144 / 172
随机 min/avg (μs)	17.7 / 28.9	10.2 / 15.9	6.07 / 13.1
随机 IOPS	34.0k	62.3k	75.4k

Performance 的随机 4K 延迟下到 6 μs 量级，比 Entry 低三倍，对延迟敏感的 KV / 索引扫描有意义。

网络#

只在 Performance 这台跑了完整网络测试，因为是同上游，不做过多测试了。：

锚点 ping 都是单毫秒级的：8.8.8.8 0.65 ms、1.1.1.1 1.34 ms、cloudflare.com 1.10 ms、github.com 1.01 ms、baidu.com 179 ms.

Ookla speedtest 多服务器：

测速点	延迟 (ms)	下行 (Mbps)	上行 (Mbps)
Auto/Frankfurt	0.49	9117	8787
Berlin	7.25	9197	6764
New York	79.62	6062	1128
Singapore	0.95*	17483	14753
Sydney	283.63	2538	326

* 新加坡延迟 < 1 ms 是 Cloudflare/Anycast PoP 在德国本地命中，并非真的 1 ms 到新加坡。这反过来说明 DataForest 上游到 Cloudflare 一跳之内。

iperf3 打 online.net 巴黎 LG，4 stream 5 秒收 8.17 Gbps；OVH 100 MB 文件单线程 223 MB/s（约 1.78 Gbps）。

业务负载#

PostgreSQL 17#

数据集 16 表 × 200k 行 ≈ 3 GB，sysbench oltp 跑 120 秒。

测试	Entry	Standard	Performance
OLTP 读写 (8 线程) tps	1,778	2,395	2,434
OLTP 读写 p95 延迟 (ms)	6.09	4.82	5.00
Point-Select (16 线程) qps	127,984	237,932	247,826
pgbench TPC-B (s=50, c=16) tps	6,643	7,716	8,013

混合读写下 Standard 和 Performance 差距只有 1.6%，这意味着你跑 PG 跑 MySQL 跑常见 OLTP，Standard 完全够用。Point-Select 这种纯索引查找差距大一点（Performance +4%），高频对单条短查询更友好，但提升不大。

Redis 7（pipeline=16, c=50）#

这应该是 Performance 的主力项目了：

命令	Entry RPS	Standard RPS	Performance RPS
SET	1,136,363	1,742,160	3,164,556
GET	1,366,120	1,886,792	3,649,635
INCR	1,222,493	1,851,851	3,496,503
LPUSH	1,033,057	1,672,240	2,994,012
LPOP	968,992	1,552,795	2,688,172

Performance 几乎翻倍打 Standard。Redis 是单线程模型，这里 5 GHz 优势全部兑现成 QPS。如果你跑高 QPS 缓存层，Performance 是这次评测里 ROI 最高的选择，没有之一。

Nginx + wrk（4 线程、c=200、30s）#

路径	Entry	Standard	Performance
/1k.bin Req/s	282,069	244,144	261,843
/100k.bin Req/s	95,234	89,691	93,230

打开看可能要怀疑人生——Entry 反超了。原因是 wrk + nginx 走 loopback，瓶颈在 syscall 路径和中断分布，4 vCPU 都跑满之后频率优势就没了，反倒 Entry 那张 Cascade Lake 的 HT 排布在这种高 IRQ 场景下更稳。100k 大文件三家拉平，差距 5% 以内。纯静态站，三档随便选。（但讲道理，静态限制都能放cloudflare了吧）

Node.js HTTP#

路径	Entry	Standard	Performance
GET / (返回 JSON) Req/s	30,000	86,228	96,496
GET /hash (PBKDF2 2000 轮) Req/s	3,599	14,512	15,440

Node 的 V8 JIT 同时吃频率和 IPC，Performance 比 Standard 多 12%、比 Entry 多 3 倍多。如果你的业务是 Node API、SSR、BFF 这一类，Performance 的差价就开始有意义了。

编译类（make / cargo / go build / docker build）#

任务	Entry	Standard	Performance
Go build (cold / warm)	8.88 / 0.08 s	5.83 / 0.05 s	5.99 / 0.04 s
Rust build cold (serde+serde_json)	8.83 s	4.05 s	4.24 s
Docker pull node<22-alpine>	5.20 s	4.53 s	4.56 s
Docker run hello-world × 50	20.37 s	14.70 s	14.35 s
Docker build node 应用 cold	4.47 s	3.04 s	2.75 s
OpenSSL 3.3 build_libs (make -j4)	40.51 s	34.99 s	34.78 s
git clone —depth=1 cli/cli	1.67 s	1.31 s	1.24 s

Rust cold build测试中：Standard 比 Performance 还快 0.2 秒。其它编译任务两家差距都在 3% 以内。结论很清楚——CI runner 选 Standard，这 6 €/月的差价在编译里完全感受不到。

看来官方的定位还是相当准确的

jq 处理 30 万对象的 JSON#

	Entry	Standard	Performance
filter	1.06 s	0.44 s	0.43 s
sum	1.21 s	0.41 s	0.38 s

数据处理类小工具，Standard / Performance 完全打平。

下面是一些赛博甜品测试

Yabs#

1
Basic System Information:
2
---------------------------------
3
Uptime     : 1 days, 4 hours, 8 minutes
4
Processor  : AMD EPYC 9575F 64-Core Processor
5
CPU cores  : 4 @ 3299.998 MHz
6
AES-NI     : ✔ Enabled
7
VM-x/AMD-V : ✔ Enabled
8
RAM        : 15.6 GiB
9
Swap       : 1024.0 MiB
10
Disk       : 157.4 GiB
11
Distro     : Debian GNU/Linux 13 (trixie)
12
Kernel     : 6.12.74+deb13+1-amd64
13
VM Type    : KVM
14
IPv4/IPv6  : ✔ Online / ✔ Online
15

16
IPv6 Network Information:
17
---------------------------------
18
ISP        : dataforest GmbH
19
ASN        : AS58212 dataforest GmbH
20
Host       : dataforest GmbH
21
Location   : Frankfurt am Main, Hesse (HE)
22
Country    : Germany
23

24
fio Disk Speed Tests (Mixed R/W 50/50) (Partition /dev/sda2):
25
---------------------------------
26
Block Size | 4k            (IOPS) | 64k           (IOPS)
27
  ------   | ---            ----  | ----           ----
28
Read       | 536.33 MB/s (134.0k) | 6.66 GB/s   (104.0k)
29
Write      | 537.75 MB/s (134.4k) | 6.69 GB/s   (104.6k)
30
Total      | 1.07 GB/s   (268.5k) | 13.35 GB/s  (208.7k)
31
           |                      |
32
Block Size | 512k          (IOPS) | 1m            (IOPS)
33
  ------   | ---            ----  | ----           ----
34
Read       | 40.05 GB/s   (78.2k) | 45.10 GB/s   (44.0k)
35
Write      | 42.18 GB/s   (82.3k) | 48.10 GB/s   (46.9k)
36
Total      | 82.24 GB/s  (160.6k) | 93.20 GB/s   (91.0k)
37

38

39
iperf3 Network Speed Tests (IPv4):
40
---------------------------------
41
Provider        | Location (Link)           | Send Speed      | Recv Speed      | Ping
42
-----           | -----                     | ----            | ----            | ----
43
Clouvider       | London, UK (10G)          | 9.00 Gbits/sec  | 4.95 Gbits/sec  | 14.6 ms
44
Eranium         | Amsterdam, NL (100G)      | 16.7 Gbits/sec  | 3.69 Gbits/sec  | 6.40 ms
45
Uztelecom       | Tashkent, UZ (10G)        | 1.93 Gbits/sec  | 1.00 Gbits/sec  | 77.2 ms
46
Leaseweb        | Singapore, SG (10G)       | 1.03 Gbits/sec  | 736 Mbits/sec   | 158 ms
47
Clouvider       | Los Angeles, CA, US (10G) | 917 Mbits/sec   | 1.46 Gbits/sec  | 139 ms
48
Leaseweb        | NYC, NY, US (10G)         | 1.99 Gbits/sec  | 2.27 Gbits/sec  | --
49
Edgoo           | Sao Paulo, BR (1G)        | 979 Mbits/sec   | busy            | 240 ms
50

51
iperf3 Network Speed Tests (IPv6):
52
---------------------------------
53
Provider        | Location (Link)           | Send Speed      | Recv Speed      | Ping
54
-----           | -----                     | ----            | ----            | ----
55
Clouvider       | London, UK (10G)          | busy            | 2.94 Gbits/sec  | 14.6 ms
56
Eranium         | Amsterdam, NL (100G)      | 16.2 Gbits/sec  | 15.4 Gbits/sec  | 6.40 ms
57
Uztelecom       | Tashkent, UZ (10G)        | 2.07 Gbits/sec  | busy            | 78.1 ms
58
Leaseweb        | Singapore, SG (10G)       | 1.02 Gbits/sec  | 1.17 Gbits/sec  | --
59
Clouvider       | Los Angeles, CA, US (10G) | busy            | busy            | 139 ms
60
Leaseweb        | NYC, NY, US (10G)         | 2.20 Gbits/sec  | 2.70 Gbits/sec  | 83.1 ms
61
Edgoo           | Sao Paulo, BR (1G)        | 569 Mbits/sec   | 852 Mbits/sec   | 241 ms
62

63
Geekbench 5 Benchmark Test:
64
---------------------------------
65
Test            | Value
66
                |
67
Single Core     |  2290
68
Multi Core      |   7921
69
Full Test       | https://browser.geekbench.com/v5/cpu/24273345
70

71

72
Geekbench 6 Benchmark Test:
73
---------------------------------
74
Test            | Value
75
                |
76
Single Core     |  2994
77
Multi Core      |   9062
78
Full Test       |  https://browser.geekbench.com/v6/cpu/17830318

1
Basic System Information:
2
---------------------------------
3
Uptime     : 0 days, 0 hours, 19 minutes
4
Processor  : Intel(R) Xeon(R) Gold 6230R CPU @ 2.10GHz
5
CPU cores  : 2 @ 2095.078 MHz
6
AES-NI     : ✔ Enabled
7
VM-x/AMD-V : ✔ Enabled
8
RAM        : 3.8 GiB
9
Swap       : 1024.0 MiB
10
Disk       : 39.3 GiB
11
Distro     : Debian GNU/Linux 13 (trixie)
12
Kernel     : 6.12.63+deb13-amd64
13
VM Type    : KVM
14
IPv4/IPv6  : ✔ Online / ✔ Online
15

16
IPv6 Network Information:
17
---------------------------------
18
ISP        : dataforest GmbH
19
ASN        : AS58212 dataforest GmbH
20
Host       : dataforest GmbH
21
Location   : Frankfurt am Main, Hesse (HE)
22
Country    : Germany
23

24
fio Disk Speed Tests (Mixed R/W 50/50) (Partition /dev/sda2):
25
---------------------------------
26
Block Size | 4k            (IOPS) | 64k           (IOPS)
27
  ------   | ---            ----  | ----           ----
28
Read       | 340.60 MB/s  (85.1k) | 4.60 GB/s    (71.9k)
29
Write      | 341.50 MB/s  (85.3k) | 4.63 GB/s    (72.3k)
30
Total      | 682.11 MB/s (170.5k) | 9.23 GB/s   (144.3k)
31
           |                      |
32
Block Size | 512k          (IOPS) | 1m            (IOPS)
33
  ------   | ---            ----  | ----           ----
34
Read       | 14.38 GB/s   (28.0k) | 12.37 GB/s   (12.0k)
35
Write      | 15.15 GB/s   (29.5k) | 13.19 GB/s   (12.8k)
36
Total      | 29.53 GB/s   (57.6k) | 25.57 GB/s   (24.9k)
37

38

39
Geekbench 5 Benchmark Test:
40
---------------------------------
41
Test            | Value
42
                |
43
Single Core     |   859
44
Multi Core      |    1683
45
Full Test       | https://browser.geekbench.com/v5/cpu/24264696

结论#

关于 Performance 这档值不值。 它官方宣传是”CPU 优化、IOPS-optimised”。CPU 的实际收益体现在 Redis（翻倍）、Node（+12%）、单核数据库点查（+4%），其他场景跟 Standard 没差。所谓 IOPS 最大化只在 ioping 微延迟和 4K 写 IOPS 上看得到，落到 fsync 这种数据库真实写场景上，三档几乎一样。

Standard 它是这家三档里的甜点位。便宜 Performance 27%，DB / 编译 / Nginx 全打平，内存带宽（STREAM）反而更高。除非你明确知道自己吃单核，默认就该选 Standard。

Entry 建议不买，外面有更好的。。。。

网络法兰克福本地 9 Gbps 双向、欧洲互访 6–9 Gbps、Cloudflare 一跳，这是这家最强的部分。但没有亚太回程优化，国内访问 180 ms 起跳

稳定性 70 多项测试，三台 steal 全程为 0，watchdog 没触发过一次，整套跑下来 2 小时 50 分。

总结：Redis / 高 QPS API → Performance；几乎其它一切 → Standard；纯开发测试机 → Entry L。（但我总觉得 Entry 没有买的必要，其他家有更好的）