apache · liamzwbao · Mar 2, 2026 · Mar 17, 2026 · Mar 17, 2026 · Mar 19, 2026
diff --git a/arrow-json/src/reader/list_array.rs b/arrow-json/src/reader/list_array.rs
@@ -17,10 +17,10 @@
 
 use crate::reader::tape::{Tape, TapeElement};
 use crate::reader::{ArrayDecoder, DecoderContext};
-use arrow_array::OffsetSizeTrait;
 use arrow_array::builder::{BooleanBufferBuilder, BufferBuilder};
-use arrow_buffer::buffer::NullBuffer;
-use arrow_data::{ArrayData, ArrayDataBuilder};
+use arrow_array::{Array, GenericListArray, OffsetSizeTrait, make_array};
+use arrow_buffer::{OffsetBuffer, ScalarBuffer, buffer::NullBuffer};
+use arrow_data::ArrayData;
 use arrow_schema::{ArrowError, DataType};
 use std::marker::PhantomData;
 
@@ -91,17 +91,17 @@ impl<O: OffsetSizeTrait> ArrayDecoder for ListArrayDecoder<O> {
             offsets.append(offset)
         }
 
-        let child_data = self.decoder.decode(tape, &child_pos)?;
+        let field = match &self.data_type {
+            DataType::List(f) | DataType::LargeList(f) => f.clone(),
+            _ => unreachable!(),
+        };
+        // SAFETY: offsets are built monotonically starting from 0
+        let offsets =
+            unsafe { OffsetBuffer::<O>::new_unchecked(ScalarBuffer::from(offsets.finish())) };
+        let values = make_array(self.decoder.decode(tape, &child_pos)?);
         let nulls = nulls.as_mut().map(|x| NullBuffer::new(x.finish()));
 
-        let data = ArrayDataBuilder::new(self.data_type.clone())
-            .len(pos.len())
-            .nulls(nulls)
-            .add_buffer(offsets.finish())
-            .child_data(vec![child_data]);
-
-        // Safety
-        // Validated lengths above
-        Ok(unsafe { data.build_unchecked() })
+        let array = GenericListArray::<O>::try_new(field, offsets, values, nulls)?;
     /// * `offsets.len() - 1 != nulls.len()` 
     /// * `offsets.last() > values.len()` 
     /// * `!field.is_nullable() && values.is_nullable()` 
     /// * `field.data_type() != values.data_type()` 
     pub fn try_new( 
         field: FieldRef, 
         offsets: OffsetBuffer<OffsetSize>, 
         values: ArrayRef, 
         nulls: Option<NullBuffer>, 
     ) -> Result<Self, ArrowError> { 
         let len = offsets.len() - 1; // Offsets guaranteed to not be empty 
         let end_offset = offsets.last().unwrap().as_usize(); 
         // don't need to check other values of `offsets` because they are checked 
         // during construction of `OffsetBuffer` 
         if end_offset > values.len() { 
             return Err(ArrowError::InvalidArgumentError(format!( 
                 "Max offset of {end_offset} exceeds length of values {}", 
                 values.len() 
             ))); 
         } 
         if let Some(n) = nulls.as_ref() { 
             if n.len() != len { 
                 return Err(ArrowError::InvalidArgumentError(format!( 
                     "Incorrect length of null buffer for {}ListArray, expected {len} got {}", 
                     OffsetSize::PREFIX, 
                     n.len(), 
                 ))); 
             } 
         } 
         if !field.is_nullable() && values.is_nullable() { 
             return Err(ArrowError::InvalidArgumentError(format!( 
                 "Non-nullable field of {}ListArray {:?} cannot contain nulls", 
                 OffsetSize::PREFIX, 
                 field.name() 
             ))); 
         } 
         if field.data_type() != values.data_type() { 
             return Err(ArrowError::InvalidArgumentError(format!( 
                 "{}ListArray expected data type {} got {} for {:?}", 
                 OffsetSize::PREFIX, 
                 field.data_type(), 
                 values.data_type(), 
                 field.name() 
             ))); 
         } 
     /// * `offsets.len() - 1 != nulls.len()` 
     /// * `offsets.last() > values.len()` 
     /// * `!field.is_nullable() && values.is_nullable()` 
     /// * `field.data_type() != values.data_type()` 
     pub fn try_new( 
         field: FieldRef, 
         offsets: OffsetBuffer<OffsetSize>, 
         values: ArrayRef, 
         nulls: Option<NullBuffer>, 
     ) -> Result<Self, ArrowError> { 
         let len = offsets.len() - 1; // Offsets guaranteed to not be empty 
         let end_offset = offsets.last().unwrap().as_usize(); 
         // don't need to check other values of `offsets` because they are checked 
         // during construction of `OffsetBuffer` 
         if end_offset > values.len() { 
             return Err(ArrowError::InvalidArgumentError(format!( 
                 "Max offset of {end_offset} exceeds length of values {}", 
                 values.len() 
             ))); 
         } 
  
         if let Some(n) = nulls.as_ref() { 
             if n.len() != len { 
                 return Err(ArrowError::InvalidArgumentError(format!( 
                     "Incorrect length of null buffer for {}ListArray, expected {len} got {}", 
                     OffsetSize::PREFIX, 
                     n.len(), 
                 ))); 
             } 
         } 
         if !field.is_nullable() && values.is_nullable() { 
             return Err(ArrowError::InvalidArgumentError(format!( 
                 "Non-nullable field of {}ListArray {:?} cannot contain nulls", 
                 OffsetSize::PREFIX, 
                 field.name() 
             ))); 
         } 
  
         if field.data_type() != values.data_type() { 
             return Err(ArrowError::InvalidArgumentError(format!( 
                 "{}ListArray expected data type {} got {} for {:?}", 
                 OffsetSize::PREFIX, 
                 field.data_type(), 
                 values.data_type(), 
                 field.name() 
             ))); 
         } 
+        Ok(array.into_data())
     }
 }