如何在 Bevy 游戏引擎中为我的 3D 体素游戏绘制多个10000个立方体?

问题描述

当我在 bevy 中创建一个 100 x 100 的立方体块时,它只能保持 10 fps。
即使我用更简单的东西(如飞机)替换立方体,我也不会从中获得更好的性能
我用 mangohud 对它进行了基准测试,它说,我的 cpu 和 GPU 的使用率只有 20% 左右。

这是我用来生成具有 OpenSimplex 噪声的 32 x 32 块的代码

    commands: &mut Commands,mut meshes: ResMut<Assets<Mesh>>,mut materials: ResMut<Assets<StandardMaterial>>,asset_server: Res<AssetServer>,seed: Res<Seed>,) {
    let noise = OpenSimplex::new();

    commands
        .spawn(PbrBundle {
            mesh: meshes.add(Mesh::from(shape::Plane{ size: 1.0 })),material: materials.add(Color::rgb(0.5,0.5,1.0).into()),transform: Transform::from_translation(Vec3::new(0.0,0.0,0.0)),..Default::default()
        })
        .with(Chunk)
        .with_children(|parent| {

        let texture_handle = asset_server.load("textures/dirt.png");
    
        for x in -32 .. 32 {
            for z in -32 .. 32 {
                let y = (noise.get([
                    ( x as f32 / 20. ) as f64,( z as f32 / 20. ) as f64,seed.value,]) * 15. + 16.0) as u32;


                parent
                    .spawn(PbrBundle {
                        mesh: meshes.add(Mesh::from(shape::Cube{ size: 1.0 })),material: materials.add(StandardMaterial { albedo: Color::rgba(1.0,1.0,1.0),albedo_texture: Some(texture_handle.clone()),..Default::default() }),transform: Transform::from_translation(Vec3::new(x as f32,y as f32,z as f32)),..Default::default()
                    })
                .with(Cube);
            }
        }
    });
}

但 32 x 32 是可玩体验的绝对最大值。 我必须做什么才能同时绘制多个块?

系统规格:
cpu: Intel Core i7-6820HQ cpu @ 2.70GHz
igpu:Intel HD Graphics 530
显卡:Nvidia Quadro M2000M

但是当卸载到更强大的 dgpu 时,我没有获得更好的性能

解决方法

一些立即可见的优化:

  • 将嵌套的 for-loop 算法转换为单个 for-loop
    • 它对缓存更友好。
    • 使用数学将现在的单一索引拆分为 x/y/z 值以确定位置。
  • 隐藏表面去除。
    • 在网格创建过程中,不是创建一个全新的立方体来添加到网格(6 个面、12 个三角形、24 个顶点)中,而是将面(2 个三角形)添加到实际可见的网格中。 IE。那些在那个方向没有相邻的不透明(非空气)块的那些。
  • 使用索引绘图而不是基于顶点的绘图
  • 使用 TextureAtlas。
    • 为每个立方体使用一个大纹理,而不是每个立方体使用一个纹理。
,

这实际上是引擎的问题,但会随着 0.5.0 版本的发布而改进。