问题描述
当我在 bevy 中创建一个 100 x 100 的立方体块时,它只能保持 10 fps。
即使我用更简单的东西(如飞机)替换立方体,我也不会从中获得更好的性能。
我用 mangohud 对它进行了基准测试,它说,我的 cpu 和 GPU 的使用率只有 20% 左右。
这是我用来生成具有 OpenSimplex 噪声的 32 x 32 块的代码
commands: &mut Commands,mut meshes: ResMut<Assets<Mesh>>,mut materials: ResMut<Assets<StandardMaterial>>,asset_server: Res<AssetServer>,seed: Res<Seed>,) {
let noise = OpenSimplex::new();
commands
.spawn(PbrBundle {
mesh: meshes.add(Mesh::from(shape::Plane{ size: 1.0 })),material: materials.add(Color::rgb(0.5,0.5,1.0).into()),transform: Transform::from_translation(Vec3::new(0.0,0.0,0.0)),..Default::default()
})
.with(Chunk)
.with_children(|parent| {
let texture_handle = asset_server.load("textures/dirt.png");
for x in -32 .. 32 {
for z in -32 .. 32 {
let y = (noise.get([
( x as f32 / 20. ) as f64,( z as f32 / 20. ) as f64,seed.value,]) * 15. + 16.0) as u32;
parent
.spawn(PbrBundle {
mesh: meshes.add(Mesh::from(shape::Cube{ size: 1.0 })),material: materials.add(StandardMaterial { albedo: Color::rgba(1.0,1.0,1.0),albedo_texture: Some(texture_handle.clone()),..Default::default() }),transform: Transform::from_translation(Vec3::new(x as f32,y as f32,z as f32)),..Default::default()
})
.with(Cube);
}
}
});
}
但 32 x 32 是可玩体验的绝对最大值。 我必须做什么才能同时绘制多个块?
系统规格:
cpu: Intel Core i7-6820HQ cpu @ 2.70GHz
igpu:Intel HD Graphics 530
显卡:Nvidia Quadro M2000M
但是当卸载到更强大的 dgpu 时,我没有获得更好的性能。
解决方法
一些立即可见的优化:
- 将嵌套的
for-loop
算法转换为单个for-loop
。- 它对缓存更友好。
- 使用数学将现在的单一索引拆分为 x/y/z 值以确定位置。
- 隐藏表面去除。
- 在网格创建过程中,不是创建一个全新的立方体来添加到网格(6 个面、12 个三角形、24 个顶点)中,而是将面(2 个三角形)添加到实际可见的网格中。 IE。那些在那个方向没有相邻的不透明(非空气)块的那些。
- 使用索引绘图而不是基于顶点的绘图
- 使用 TextureAtlas。
- 为每个立方体使用一个大纹理,而不是每个立方体使用一个纹理。
这实际上是引擎的问题,但会随着 0.5.0 版本的发布而改进。